دانلود ترجمه مقاله موتور جستجو با منبع باز و رایگان
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
موتور جستجوی با برنامه منبع باز و رایگان |
عنوان انگلیسی مقاله: |
Nutch- Free and Open Source search engine |
|
مشخصات مقاله انگلیسی و ترجمه فارسی | |
سال انتشار مقاله | 2006 |
تعداد صفحات مقاله انگلیسی | 6 صفحه با فرمت pdf |
تعداد صفحات ترجمه مقاله | 5صفحه با فرمت word به صورت تایپ شده با قابلیت ویرایش |
رشته های مرتبط با این مقاله | مهندسی کامپیوتر و مهندسی فناوری اطلاعات |
گرایش های مرتبط با این مقاله | مهندسی نرم افزار، مهندسی الگوریتم ها و محاسبات، طراحی و تولید نرم افزار، برنامه نویسی کامپیوتر و هوش مصنوعی |
رفرنس | ندارد |
- بخشی از ترجمه:
چکیده ترجمه:
پروژه Nutch، تلاشی برای ایجاد موتورهای جستجوی منبع باز و رایگان می باشد. این پروژه از Lucene به منظور جستجو و ابزار شاخص استفاده می کند. فتچر (روبات) از ابتدا برای این پروژه نوشته شد. پروژه Nutchدارای معماری مدولار سطح بالایی می باشد که به طراحان این امکان را می دهد تا پلاگین هایی را برای فعالیت ها همانند تحلیل نوع رسانه، بازیابی اطلاعات، جستجو و خوشه بندی، ایجاد کنند.
داگ کاتینگ به عنوان یکی از توسعه دهندگان پیشگام در پروژه Nutch می باشد.
Lucene چیست؟
Lucene به عنوان یکی از نرم افزارهای منبع باز و شاخص رابط برنامه کاربردی (رابط برنامه کاربردی) می باشد که توسط موسسه آپاچی انتشار یافته است. Lucene به صورت جاوا نوشته شده و تحت لیسانس نرم افزاری موسسه آپاچی انتشار یافته است.
Lucene به عنوان هسته مرکزی موتور جستجو می باشد. به این ترتیب آن شامل مواردی همانند شبکه های عنکبوتی و برنامه های تجزیه کننده در ارتباط با فرمت های اسناد نمی باشد. در عوض چنین مواردی می بایست توسط افرادی اضافه گردد که از Lucene استفاده می کنند.
Lucene در ارتباط با منابع اطلاعاتی، فرمت خاص، و یا زبان خاصی نمی باشد و شما می توانید آن را به متن تبدیل کنید. این بدین معنی می باشد که شما می توانید از Lucene برای ایجاد شاخص و جستجوی اطلاعات ذخیره شده در فایل، صفحات وب بر روی سرورهای شبکه از راه دور و اسناد ذخیره شده در فایل های سیستمی محلی، فایل های متنی ساده، اسناد مایکروسافت، فایل های PDF یا HTML یا فرمت های دیگر، که شما می توانید اطلاعات متنی را از آن دریافت کنید، استفاده کنید.
Lucene در فرایند جریان انتقال به زبان های برنامه نویسی دیگر به غیر از جاوا قرار می گیرد.
١.٣ پروانه کسب (لیسانس) چیست ؟
Lucene و Nutch به عنوان پروژه آپاچی بوده و تحت لیسانس آپاچی قرلر دارند.
٢ طراحی Nutch
٢.١ اجزای اصلی Nutch
موتور جستجوی Nutch شامل سه بخش می باشد:
١- کرالر، که به اکتشاف و بازیابی صفحات وب می پردازد.
٢- WebDB، پایگاه اطلاعاتی به ذخیره URL پرداخته و محتوای صفحات را جمع آوری می کند.
٣- برنامه لکسندر، که صفحات را از هم جدا کرده و بر اساس آن ها شاخص های بر مبنای کیبورد را می سازد.
- بخشی از مقاله انگلیسی:
Nutch is an effort to build a Free and Open Source search engine. It uses Lucene for the search and index component. The fetcher (robot) has been written from scratch solely for this project. Nutch has a highly modular architecture allowing developers to create plug-ins for activities such as media-type parsing, data retrieval, querying and clustering. Doug Cutting is the lead developer of Nutch. 1.2 What is Lucene? Lucene is a Free and Open Source search and index API released by the Apache Software Foundation. It is written in Java and is released under the Apache Software License. Lucene is just the core of a search engine. As such, it does not include things like a web spider or parsers for different document formats. Instead these things need to be added by a developer who uses Lucene. Lucene does not care about the source of the data, its format, or even its language, as long as you can convert it to text. This means you can use Lucene to index and search data stored in files: web pages on remote web servers, documents stored in local file systems, simple text files, Microsoft Word documents, HTML or PDF files, or any other format from which you can extract textual information. Lucene has been ported or is in the process of being ported to various programming languages other than Java: 1.3 What License? Both Nutch and Lucene are Apache projects and carry the Apache license 2 The Design of Nutch The Nutch search engine consists, very roughly, of three components: From Wikipedia, the free encyclopedia Nutch- Free and Open Source search engine 1. The Crawler, which discovers and retrieves web pages 2. The ‘WebDB’, a custom database that stores known URLs and fetched page contents 3. The ‘Indexer’, which dissects pages and builds keyword-based indexes from them After the initial creation of an Index, it is usual to perform periodic updates of the index, in order to keep it up-to-date. We will look into the details of index maintenance in the parts following this.
دانلود رایگان مقاله انگلیسی + خرید ترجمه فارسی
|
|
عنوان فارسی مقاله: |
موتور جستجو با برنامه منبع باز و رایگان |
عنوان انگلیسی مقاله: |
Nutch- Free and Open Source search engine |
|