ویژگی های مهتاب

تشخیص انواع کپی برداری های دقیق، کپی برداری با تغییرات، تغییر ساختار جملات، جایگزینی معنایی کلمات و بازنویسی جملات

نمایش محل دقیق شباهت و درصد شباهت قطعه نمایش داده شده

اتصال به پیکره مهتاب شامل 20 هزار سند فارسی

مشابهت یابی تک زبانه میان اسناد فارسی

درباره ما

آزمایشگاه پردازش زبان طبیعی دانشگاه شهید بهشتی در سال 1386 تحت سرپرستی دکتر مهرنوش شمس‌فرد آغاز به کار نمود. عمده فعالیت‌های این آزمایشگاه در دو حوزه پردازش زبان طبیعی با تاکید بر زبان فارسی و مهندسی هستان‌شناسی دسته‌بندی می‌شود. اعضا و همکاران آزمایشگاه عمدتا از دانشجویان و فارغ‌التحصیلان دانشکده مهندسی و علوم کامپیوتر دانشگاه شهید بهشتی و یا دانشجویان و فارغ‌التحصیلان رشته زبان شناسی دانشگاه‌های تهران، شهید بهشتی و علامه طباطبایی هستند که در پروژه‌های تحقیقاتی با این آزمایشگاه همکاری دارند. این آزمایشگاه در حال حاضر دارای حدود 35 عضو فعال است که در مقاطع دکتری، کارشناسی ارشد و کارشناسی مشغول به تحصیل‌اند و یا در طرح‌های برون سازمانی همکاری می‌کنند.

خدمات

مهتاب سیستم مشابهت یابی است که در زمینه کشف تقلب در اسناد علمی فارسی، در آزمایشگاه پردازش زبان طبیعی دانشگاه شهید بهشتی توسعه یافته است. نسخه اول مهتاب روی اسناد علمی حوزه برق و کامپیوتر تمرکز دارد بطوری که این سیستم اسناد پرس‌وجو را با پایگاه‌داده‌ای متشکل از بیست هزار مقاله و پایان‌نامه‌های حوزه برق و کامپیوتر مورد مقایسه قرار می‌دهد و اسناد پایگاه داده را بر اساس میزان شباهتشان به سند پرس‌و‌جو رتبه‌بندی کرده و به کاربر نمایش می‌دهد. مهتاب امکان کشف مشابهت در محتوای فارسی و انگلیسی و همچنین محتوای تصویری اسناد را داراست.

ارتباط با ما

آدرس: ولنجک، بلوار دانشجو، دانشگاه شهید بهشتی، دانشکده علوم و مهندسی کامپیوتر، طبقه دوم، اتاق 228، آزمایشگاه پردازش زبان طبیعی

تلفن: 021-29904111

ایمیل: nlp@sbu.ac.ir