وبلاگ شرکت کارانس ایرانیان

رسانه متنی شرکت کارانس در دنیای وب

وبلاگ شرکت کارانس ایرانیان

رسانه متنی شرکت کارانس در دنیای وب

وبلاگ شرکت کارانس ایرانیان

۲ مطلب در آبان ۱۳۹۵ ثبت شده است

دومین همایش ملی زبان‌شناسی پیکره‌ای به همت انجمن زبان‌شناسی ایران، پنج‌شنبه 20 آبان در پژوهشگاه علوم انسانی و مطالعات فرهنگی برگزار شد.
یکی از سخنرانی‌های این همایش به شرکت کارانس اختصاص یافته بود. این سخنرانی با عنوان "پیکرۀ موجودیت‌های نامدار کارانس، تلاشی برای توسعۀ نیمه خودکار پیکره زبانی" انجام گرفت. مهندس محمدحسن بشری‌موحد (عضو تیم تحقیق و توسعه کارانس) در سخنرانی خود به معرفی روش شرکت کارانس برای توسعۀ سریع پیکره‌های بزرگ مورد نیاز برای تشخیص موجودیت‌های نامدار (نام اشخاص، سازمان، محصول، مکان و ...) پرداخت. در این روش برچسب‌زنی به صورت نیمه خودکار انجام می‌گیرد و برچسب‌‌هایی که توسط عامل انسانی روی بخشی از پیکره زده می‌شوند، توسط ماشین به تمام پیکره تعمیم می‌یابند. تلاش ایشان و دیگر پژوهشگران سهیم در این پروژه، به ویژه زحمات مهندس سیدمرتضی خالقی (مدیر تحقیق و توسعه شرکت کارانس) ستودنی است.

۰ نظر موافقین ۰ مخالفین ۰ ۲۰ آبان ۹۵ ، ۱۳:۵۰

برای پردازش زبان طبیعی به ابزارهایی نیاز است که پیش پردازش های اولیه را انجام دهند تا داده های جمع آوری شده وارد فرآیند پردازش اصلی مورد نیاز سیستم بشوند. هدف از بکارگیری این ابزارها افزایش سرعت پردازش و بهبود صحت نتایج خروجی است. عنوان کلی ابزارها مورد نیاز برای پردازش متن در ادامه تقدیم می گردد. در پست های آینده با تک تک این ابزارها و کاربرد هر یک آشنا خواهید شد.

عناوین ابزارهای پردازش متن:

- پارسر

- یکسان ساز

- تشخیص دهنده جمله

- تشخیص دهنده واژه

- ریشه یاب

- تشخیص دهنده اسامی

- برچسب گذار واژه و معنا

- مجموعه واژگان


۰ نظر موافقین ۰ مخالفین ۰ ۰۶ آبان ۹۵ ، ۱۲:۲۰