📌 ردهبندی یا طبقهبندی، یکی از کاربردهای مهم در حوزههای مختلف است که در هر حوزه متناسب با نیاز مورد استفاده قرار میگیرد. ردهبندی سوالات نیز در بخشهای مختلف کاربرد دارد مثلا با دستهبندی سوالات میتوان پاسخدهی آنها را اولویتبندی کرد یا مثلا با دستهبندی آنها بر اساس جنسیت میتوان انتخاب کرد که چه کسی پاسخ سوال را بدهد و ... . کار دسته بندی سوالات را میتوان به صورت ماشینی انجام داد. در اینجا ما به کمک روشهای مختلف و با بهرهگیری از شبکههای عمیق چندین ردهبند ایجاد کردیم که میتوانند بسته به کاربردهای مختلف مورد استفاده قرار گیرند.
1. ردهبندی بر اساس جنسیت:
این ردهبند بر روی سوالات موجود در یک سایت عربی که جنسیت پرسشکننده در آن مشخص بود آموزش داده شد ولی از آنجایی که بسیاری سوالات از نظر مفهومی به جنسیت بستگی ندارد بنابراین نمیتوان انتظار دقت بسیار بالایی از آن داشت. اما با توجه به آزمایش روشهای مختلف و برآورد خروجی در بهترین حالت به دقت حدود 66 درصد رسیدیم.
2. ردهبند بر اساس سن:
این ردهبند بر روی سوالات عربی که سن پرسشکننده در آن مشخص بود آموزش داده شد. در ابتدا سن افراد در بازههای 10 ساله (10 بازه سنی از 1 تا 100 سال) تفکیک شد که با تست روشهای مختلف به دقت حدود 35 درصد رسیدیم. در مرحله دوم افراد را به 4 دوره زندگی تقسیم کردیم (دوره نوجوانی تا سن 19 سال، دوره جوانی از 20 تا 32 سال، دوره میانسالی از 33 تا 50 سال و دوره پیری از 51 سال به بالا). با استفاده از این داده روشهای مختلف آزمایش شد که با توجه به اینکه طبیعتا بسیاری از سوالات به سن افراد بستگی ندارد خروجی در حدود 45 درصد به دست آمد.
3. ردهبند بر اساس تگ در زبان عربی:
در ابتدا برای ساخت ردهبند نیاز به ساخت یک دیتاست مناسب با تگهای محدود بود. برای این کار ابتدا از بین چند هزار تگ مختلف به 5 تگ (الصلاة، الخمس، القرآن و الحدیث، الصوم و الطهارت) رسیدیم که بسیاری از تگ های موجود را در این 5 تگ بستهبندی کردیم. در مرحله بعد به کمک سوالات موجود که در این 5 دسته، بستهبندی شده بودند، ردهبندهای مختلف به کمک روشهای گوناگون ساخته شد که در بهترین روش به دقت حدود 92 درصد رسیدیم.
4. ردهبند بر اساس تگ در زبان فارسی:
در ابتدا برای ساخت ردهبند نیاز به ساخت یک دیتاست مناسب با تگهای محدود بود. برای این کار ابتدا از بین چند هزار تگ مختلف به 8 تگ (اخلاق و عرفان، سیاسی و اجتماعی، قرآن و حدیث، تاریخ و سیره، عقاید و کلام، مهدویت، احکام و دینشناسی) رسیدیم که بسیاری از تگ های موجود را در این 8 تگ بستهبندی کردیم. در مرحله بعد به کمک سوالات موجود که در این 8 دسته، بستهبندی شده بودند، ردهبندهای مختلف به کمک روشهای گوناگون ساخته شد که در بهترین روش به دقت حدود 93 درصد رسیدیم.