درس بازیابی اطلاعات برای اولین بار کشور در دانشگاه شریف و در سال 1384 توسط دکتر ابولحسنی ارائه شد. از ان زمان تا کنون، این درس در دانشگاه های مختلف ارائه می شود و یکی از دروس درآزمون ورودی دکتری کشور است
مهمترین سرفصل های این درس به شرح زیر است:
- آشنایی با معماری موتورهای جستجو
- آشنایی با روش های No-sql برای ذخیره سازی داده
- چگونگی استفاده از الگوریتم های رتبه بندی
- الگوریتم های یادگیری برای رتبه بندی
- آشنایی با روش های Crawl داده از وب
با توجه به گسترش حجم داده های غیر ساختیافته (متنی)، در سازمان ها و شرکت ها این درس می تواند به شما کمک کند که به صورت کارا یک موتور جستجو برای یک کسب و کار طراحی کنید.
تکنولوژی هایی که عموما در این درس اموزش داده می شود عبارتند از:
1- آشنایی با Lucene
2- آشنایی با Elastic search
3- اشنایی با Crawler
4- آشنایی با Web page parser
دانشجویانی که علاقه مند به انجام پروژه در حوزه علوم داده (Data science) هستتند پیشنهاد می کنم که این درس را اخد نمایند.