Update note.md

2025-05-02 10:53:16 +00:00 · 2025-05-02 10:53:16 +00:00 · 677f9b28da
commit 677f9b28da
parent 67263c0e27
1 changed files with 0 additions and 13 deletions
--- a/note.md
+++ b/note.md
@ -62,19 +62,6 @@ result = get_context("شاه عباس که بود؟", crawl_params={
  └── web_results/       # پوشه نتایج خزش وب
      └── web.json       # فایل ذخیره‌سازی نتایج وب
 ```
 توضیح توابع اصلی
 load_pdf: بارگذاری، پردازش و تقسیم‌بندی محتوای فایل‌های PDF.
 search_duckduckgo: انجام جستجو در موتور جستجوی DuckDuckGo.
 crawl_page: استخراج محتوای متنی و لینک‌های موجود در یک صفحه وب.
 crawl_web: ترکیب جستجو و خزش صفحات وب برای یافتن اطلاعات مرتبط.
 build_retriever: ساخت و آماده‌سازی بازیاب (Retriever) بر اساس الگوریتم BM25 برای جستجوی کلیدواژه‌ای در اسناد.
 get_relevant_documents: یافتن مرتبط‌ترین اسناد موجود با پرسش کاربر.
 extract_context_from_documents: استخراج متن مرتبط با پرسش از اسناد یافت‌شده.
 extract_context_from_web: استخراج متن مرتبط با پرسش از نتایج خزش وب.
 get_context: تابع اصلی و رابط کاربری سیستم که فرآیند جستجو در اسناد و یا خزش وب را مدیریت کرده و نتیجه نهایی را برمی‌گرداند.
 نکات مهم
 برای افزودن اسناد PDF جدید به سیستم، از تابع load_pdf استفاده کنید:
 ```python
 rag = ModularRAG()
 rag.load_pdf("path/to/your/document.pdf")