ویژگی های مهتاب

تشخیص انواع کپی برداری های دقیق، کپی برداری با تغییرات، تغییر ساختار جملات، جایگزینی معنایی کلمات و بازنویسی جملات

نمایش محل دقیق شباهت و درصد شباهت قطعه نمایش داده شده

اتصال به پیکره مهتاب شامل 20 هزار سند فارسی

مشابهت یابی تک زبانه میان اسناد فارسی

خدمات

مهتاب سیستم مشابهت یابی است که در زمینه کشف تقلب در اسناد علمی فارسی، در آزمایشگاه پردازش زبان طبیعی دانشگاه شهید بهشتی توسعه یافته است. نسخه اول مهتاب روی اسناد علمی حوزه برق و کامپیوتر تمرکز دارد بطوری که این سیستم اسناد پرس‌وجو را با پایگاه‌داده‌ای متشکل از بیست هزار مقاله و پایان‌نامه‌های حوزه برق و کامپیوتر مورد مقایسه قرار می‌دهد و اسناد پایگاه داده را بر اساس میزان شباهتشان به سند پرس‌و‌جو رتبه‌بندی کرده و به کاربر نمایش می‌دهد. مهتاب امکان کشف مشابهت در محتوای فارسی و انگلیسی و همچنین محتوای تصویری اسناد را داراست.

درباره ما

آزمایشگاه پردازش زبان طبیعی دانشگاه شهید بهشتی در سال 1386 تحت سرپرستی دکتر مهرنوش شمس‌فرد آغاز به کار نمود. عمده فعالیت‌های این آزمایشگاه در دو حوزه پردازش زبان طبیعی با تاکید بر زبان فارسی و مهندسی هستان‌شناسی دسته‌بندی می‌شود. اعضا و همکاران آزمایشگاه عمدتا از دانشجویان و فارغ‌التحصیلان دانشکده مهندسی و علوم کامپیوتر دانشگاه شهید بهشتی و یا دانشجویان و فارغ‌التحصیلان رشته زبان شناسی دانشگاه‌های تهران، شهید بهشتی و علامه طباطبایی هستند که در پروژه‌های تحقیقاتی با این آزمایشگاه همکاری دارند. این آزمایشگاه در حال حاضر دارای حدود 35 عضو فعال است که در مقاطع دکتری، کارشناسی ارشد و کارشناسی مشغول به تحصیل‌اند و یا در طرح‌های برون سازمانی همکاری می‌کنند.