دیتاست 105هزار کتاب چاپی ایران + بهمراه جزئیات برای داده کاوی
این دیتاسیت فقط برای استفاده تحقیقاتی میباشد، لذا استفادهی تجاری از آن ممنوع میباشد.
دیتاست مخصوص پروژه های داده کاوی و پردازش زبان طبیعی در فارسی و پروژه های مختلف دانشجویی میباشد.
هیچ ردیف خالی یا نال کامل وجود ندارد اما ممکن است برخی مشخصه ها در کتابها ناقص باشند
دیتاست با فرمتهای زیپ شده CSV , SQL(MySQL) در دسترس و قابل دانلود میباشد.
راهنمای ستونها:
Column | #1 | #2 | #3 | #4 | #5 | #6 | #7 | #8 | #9 | #10 | #11 | #12 | #13 | #14 | #15 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ColumnName | id | title | publisher | writer | subject | page_num | size | cover_type | publish_date | turn_published | publish_place | Counters | Shabok | DIO_category | language |
نامستون | شناسه | عنوان | ناشر | نویسنده/گان | موضوع | تعدادصفحه | قطع | نوعجلد | تاریخانتشار | نوبتچاپ | محلنشر | شمارگان | شابک | ردهدیوی | زبان |
دیتابیس / دیتاست کتابهای چاپی ایرانی
دانلود از صفحه زیر https://github.com/mahmoud-eskandari/PersianBooksDataset/releases