دسترسی آزاد به دادههای دیوار: انتشار دیتاست یک میلیونی املاک
در یک اقدام مهم و قابل توجه در راستای تسهیل دسترسی به دادههای ارزشمند حوزه املاک برای پژوهشگران، توسعهدهندگان و نهادهای معتبر دانشگاهی، پلتفرم «دیوار» اقدام به انتشار یک مجموعه داده جامع شامل یک میلیون آگهی املاک نموده است. این مجموعه داده ارزشمند، با رعایت کامل اصول گمنامسازی اطلاعات کاربران، بر روی پلتفرم متنباز Hugging Face در دسترس عموم قرار گرفته است. هدف اصلی از این اقدام، فراهم آوردن بستری مناسب برای بهرهگیری از دادههای واقعی و گسترده در زمینه املاک به منظور انجام پروژههای تحقیقاتی متنوع و نوآورانه میباشد. علاقهمندان و متخصصان میتوانند از این مجموعه داده غنی در پروژههای مختلفی نظیر توسعه ابزارهای پیشرفته هوش مصنوعی با تمرکز بر زبان فارسی، انجام تحلیلهای دقیق بازار املاک، ساخت و توسعه مدلهای پیشبینی قیمت املاک و همچنین ایجاد و راهاندازی استارتاپهای نوین در حوزه مرتبط با املاک بهرهبرداری نمایند.
شایان ذکر است که این مجموعه داده، به عنوان نخستین مجموعه داده ساختارمند در حوزه املاک با زبان فارسی و با این سطح از حجم، کیفیت و پاکیزگی دادهها به شمار میرود که ابعاد قابل توجهی را به خود اختصاص داده است. اطلاعات موجود در این دیتاست، منتخبی از آگهیهای فعال در پلتفرم دیوار در بازه زمانی میانه سال ۱۴۰۳ بوده و از میان شهرها و محلههای گوناگون کشور، به صورت تصادفی گردآوری شده است. لازم به تأکید است که به منظور حفظ حریم خصوصی کاربران محترم دیوار، تمامی اطلاعات شخصی که به طور بالقوه میتوانست منجر به شناسایی افراد گردد، به دقت از این مجموعه داده حذف شده است و صرفاً دادههایی منتشر شده است که کاربران در زمان ثبت آگهی، اجازه انتشار عمومی آنها را صادر نموده بودند.
این دادههای ارزشمند میتوانند به عنوان یک زیرساخت قوی و مطمئن برای تیمهای پژوهشی فعال در دانشگاهها و سایر مراکز تحقیقاتی، محققان و متخصصان حوزه داده و همچنین استارتآپهای نوظهور و فعال در حوزه فناوریهای مرتبط با املاک (PropTech) در ایران مورد استفاده قرار گیرند. این گروهها میتوانند با بهرهگیری از این دادهها به توسعه و ساخت مدلهای هوشمند تخمین قیمت املاک، طراحی سیستمهای پیشرفته توصیهگر ملک به کاربران، انجام تحلیلهای متنی و استخراج کلیدواژههای مرتبط با بازار املاک و انجام پژوهشهای عمیق در زمینههای مرتبط با اقتصاد مسکن بپردازند. علاوه بر این، حجم قابل توجه این دادهها میتواند در راستای تقویت و بهبود عملکرد مدلهای زبانی فارسی نیز کاربرد داشته باشد و به طور مؤثری در توسعه ابزارهای هوش مصنوعی با قابلیت پردازش زبان فارسی نقش ایفا نماید.
ما در مجموعه دیوار بر این باوریم که توانمندسازی جامعه فنی و متخصص ایران، یک مسئولیت مشترک برای تمامی فعالان این حوزه به شمار میرود. دسترسی آسان و آزاد به دادههای باکیفیت، حق مسلم هر توسعهدهنده و پژوهشگر بوده و انتشار این مجموعه داده، گامی مهم در مسیر دموکراتیزه کردن هوش مصنوعی و دانش داده در کشور عزیزمان ایران محسوب میگردد. فراهم آوردن بستری مناسب برای همکاری، تبادل تجربیات و اشتراک دانش میان متخصصان، میتواند به خلق راهکارهای نوآورانه و مؤثری منجر شود که در نهایت، کیفیت زندگی افراد جامعه را ارتقا داده و به رشد و شکوفایی هرچه سریعتر اکوسیستم پویای فناوری و تحلیل داده در ایران کمک شایانی نماید.
اگر شما نیز مایل به استفاده از این مجموعه داده ارزشمند در پروژههای تحقیقاتی یا توسعهای خود هستید، میتوانید به وبسایت رسمی Hugging Face مراجعه نموده و به آسانی از این دیتاست بهره ببرید.
همچنین، از تمامی شما دعوت مینماییم تا در صورتی که پروژههای جالب و نوآورانهای را با استفاده از این مجموعه داده به انجام رساندید، تجربیات ارزشمند و دستاوردهای خود را با ما و سایر علاقهمندان به اشتراک بگذارید. علاوه بر این، در صورتی که پروژه توسعه داده شده توسط شما با خدمات دیوار ارتباط مستقیم داشته باشد، این امکان برای شما فراهم است تا خدمات خود را از طریق پلتفرم «کنار دیوار» به عنوان یک افزونه به کاربران گسترده دیوار ارائه نمایید.