In [2]:
#Test Dorna
response: ChatResponse = chat(model='partai/dorna-llama3', messages=[
  {
    'role': 'user',
    'content': 'چرا اینترنت قطع میشه؟',
  },
])
print(response['message']['content'])
print(response.message.content)

این یک مشکل رایج است که اغلب به دلایل مختلف ایجاد می شود. برخی از عللن های متداول قطع اینترنت عبارتند از:

1. اتصال نادرست: ممکن است اتصال شما با ارائه دهنده خدمات اینترنت (ISP) نادرست باشد، در نتیجه قطع دسترسی به اینترنت.
2. خطای شبکه: مشکلاتی مانند خرابی تجهیزات شبکه یا خطاهای مربوطه ممکن است باعث قطع اینترنت شوند.
3. مسدود بودن آدرس IP: اگر آدرس آی پی شما توسط ارائه دهنده خدمات اینترنت مسدود شود، نمی توانید به اینترنت دسترسی داشته باشید.
4. مصرف زیاد باند باس: اگر مصرف زیادی از باند باس در طول یک زمان خاص یا مداوم باشد، ممکن است موجب قطع اینترنت شود.
5. مشکلات تهدید کننده ایمنی: حملات سایبری و ویروس های رایانه ای نیز می توانند باعث قطع اینترنت شوند.

از سوی دیگر، ارائه دهندگان خدمات اینترنت اغلب در نظر می گیرند که به دلیل مسائل فنی یا نگهداری شبکه، اینترنت را برای چند ساعت یا یک روز قطع کنند. در چنین مواردی معمولاً اطلاع رسانی قبلی داده نمی شود و زمانی که مشکل حل شد، اینترنت مجدداً قابل دسترسی است.

در صورت تجربه قطع اینترنت، توصیه می شود که با ارائه دهنده خدمات اینترنت تماس بگیرید 

In [16]:
!pip install faiss-cpu sentence-transformers ollama numpy

Collecting faiss-cpu
  Downloading faiss_cpu-1.9.0.post1-cp311-cp311-win_amd64.whl.metadata (4.5 kB)
Collecting sentence-transformers
  Downloading sentence_transformers-3.4.0-py3-none-any.whl.metadata (10 kB)
Collecting transformers<5.0.0,>=4.41.0 (from sentence-transformers)
  Downloading transformers-4.48.1-py3-none-any.whl.metadata (44 kB)
     ---------------------------------------- 0.0/44.4 kB ? eta -:--:--
     --------- ------------------------------ 10.2/44.4 kB ? eta -:--:--
     --------- ------------------------------ 10.2/44.4 kB ? eta -:--:--
     -------------------------- ----------- 30.7/44.4 kB 220.2 kB/s eta 0:00:01
     -------------------------- ----------- 30.7/44.4 kB 220.2 kB/s eta 0:00:01
     -------------------------------------- 44.4/44.4 kB 168.2 kB/s eta 0:00:00
Collecting huggingface-hub>=0.20.0 (from sentence-transformers)
  Downloading huggingface_hub-0.27.1-py3-none-any.whl.metadata (13 kB)
Collecting tokenizers<0.22,>=0.21 (from transformers<5.0.0,>=

In [4]:
# MANUALLY RAG
from ollama import chat
import numpy as np
import faiss
from sentence_transformers import SentenceTransformer
import os
import re

DOCUMENT_PATHS = [
    r'C:\Users\ASUS\Downloads\Hamrah.txt', #replace path
    r'C:\Users\ASUS\Downloads\vape.txt',
    r'C:\Users\ASUS\Downloads\Shah.txt',
    r'C:\Users\ASUS\Downloads\Khalife.txt',
    r'C:\Users\ASUS\Downloads\carbon.txt',
    r'C:\Users\ASUS\Downloads\takapoo.txt'
]

EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-mpnet-base-v2'
LLM_MODEL = 'partai/dorna-llama3'
CHUNK_SIZE = 1000
OVERLAP = 200
INDEX_PATH = r'C:\Users\ASUS\Downloads\doc_index.faiss'
CHUNK_MAP_PATH = r'C:\Users\ASUS\Downloads\chunk_map.npy'

class AdvancedRAG:
    def __init__(self):
        self.encoder = SentenceTransformer(EMBEDDING_MODEL)
        self.index = None
        self.chunk_map = []
        
    def create_index(self):
        """Create FAISS index with cosine similarity and document mapping"""
        all_chunks = []
        doc_mapping = []
        
        # Process via CHUNKING (REQ 4 RAG)
        for doc_idx, path in enumerate(DOCUMENT_PATHS):
            with open(path, 'r', encoding='utf-8') as f:
                text = re.sub(r'\s+', ' ', f.read()).strip()
                chunks = [text[i:i+CHUNK_SIZE] for i in range(0, len(text), CHUNK_SIZE - OVERLAP)]
                all_chunks.extend(chunks)
                doc_mapping.extend([doc_idx] * len(chunks))
        
        # Normalized embeddings (REQ 4 cosine similarity)
        embeddings = self.encoder.encode(all_chunks)
        faiss.normalize_L2(embeddings)  
        
        # FAISS index & Mapping
        self.index = faiss.IndexFlatIP(embeddings.shape[1])
        self.index.add(embeddings.astype(np.float32))
        self.chunk_map = np.array(doc_mapping)
        
        # Index  
        faiss.write_index(self.index, INDEX_PATH)
        # Mapping 
        np.save(CHUNK_MAP_PATH, self.chunk_map)
    
    def load_index(self):
        """LOAD EXISTING DATA"""
        self.index = faiss.read_index(INDEX_PATH)
        self.chunk_map = np.load(CHUNK_MAP_PATH, allow_pickle=True)
        
    def query(self, question, doc_index, top_k=5):
        """DOCUMENT-SPECIFIC QUERY WITH COSINE SIMILARITY """
        # Encode 
        query_embed = self.encoder.encode([question])
        # Normalize 
        faiss.normalize_L2(query_embed)
        
        distances, indices = self.index.search(query_embed.astype(np.float32), top_k*3)
    
        relevant_chunks = []
        for idx in indices[0]:
            if self.chunk_map[idx] == doc_index:
                relevant_chunks.append(idx)
            if len(relevant_chunks) >= top_k:
                break
        
        return relevant_chunks

class AnswerGenerator:
    def __init__(self, rag_system):
        self.rag = rag_system
        self.chunks = [] 
        
    def get_answer(self, question, doc_index):
        """GENERATING CONTEXT-AWARE ANSWER"""
        if not self.chunks:
            self._load_chunks()
            
        chunk_indices = self.rag.query(question, doc_index)
        context = "\n".join([self.chunks[idx] for idx in chunk_indices])
        
        prompt = f"""با استفاده از متن زیر به سوال پاسخ دهید:
{context}

اگر پاسخ در متن وجود ندارد عبارت 'پاسخی یافت نشد' را برگردانید

سوال: {question}
پاسخ:"""
        
        response = chat(model=LLM_MODEL, messages=[{'role': 'user', 'content': prompt}])
        return response['message']['content']
    
    def _load_chunks(self):
        """LOAD ALL CHUNKS(LAZY)"""
        self.chunks = []
        for path in DOCUMENT_PATHS:
            with open(path, 'r', encoding='utf-8') as f:
                text = re.sub(r'\s+', ' ', f.read()).strip()
                self.chunks.extend([text[i:i+CHUNK_SIZE] for i in range(0, len(text), CHUNK_SIZE - OVERLAP)])

# MAIN EXE of RAG
if __name__ == "__main__":
    # RAG init
    rag = AdvancedRAG()
    
    if not os.path.exists(INDEX_PATH):
        print("Building optimized index...")
        rag.create_index()
    else:
        print("Loading existing index...")
        rag.load_index()
    # Answer Generator init
    generator = AnswerGenerator(rag)
    
    queries = [
        ("چرا اینترنت همراه اول گوشی وصل نمیشود؟", 0),
        ("چطوری ویپ مورد نظرمو پیدا کنم؟", 1),
        ("شاه عباس که بود؟", 2),
        ("خلیفه سلطان که بود و چه کرد؟", 3),
        ("کربن اکتیو و کربن بلک چه هستند و چه تفاوتی دارند و برای چه استفاده میشن؟", 4),
        ("شرکت تکاپو صنعت نامی چه محصولاتی ارایه میدهد؟ چه چیزی این شرکت را منحصر به فرد میسازد؟ سهام این شرکت صعودی است یا نزولی؟", 5)
    ]
    
    with open(r'C:\Users\ASUS\Downloads\representation.txt', 'w', encoding='utf-8') as f: #replace path
        for q_idx, (query, doc_idx) in enumerate(queries):
            answer = generator.get_answer(query, doc_idx)
            f.write(f"سوال {q_idx+1} ({doc_idx+1}):\n{query}\n\nپاسخ:\n{answer}\n\n{'='*50}\n\n")
            print(f"پردازش سوال {q_idx+1}/{len(queries)} تکمیل شد")

print("تمامی سوالات با موفقیت پردازش شدند!")

Building optimized index...
پردازش سوال 1/6 تکمیل شد
پردازش سوال 2/6 تکمیل شد
پردازش سوال 3/6 تکمیل شد
پردازش سوال 4/6 تکمیل شد
پردازش سوال 5/6 تکمیل شد
پردازش سوال 6/6 تکمیل شد
تمامی سوالات با موفقیت پردازش شدند!


In [1]:
!pip install langchain chromadb sentence-transformers ollama

Collecting langchain
  Downloading langchain-0.3.16-py3-none-any.whl.metadata (7.1 kB)
Collecting chromadb
  Downloading chromadb-0.6.3-py3-none-any.whl.metadata (6.8 kB)
Collecting langchain-core<0.4.0,>=0.3.32 (from langchain)
  Downloading langchain_core-0.3.32-py3-none-any.whl.metadata (6.3 kB)
Collecting langchain-text-splitters<0.4.0,>=0.3.3 (from langchain)
  Downloading langchain_text_splitters-0.3.5-py3-none-any.whl.metadata (2.3 kB)
Collecting langsmith<0.4,>=0.1.17 (from langchain)
  Downloading langsmith-0.3.2-py3-none-any.whl.metadata (14 kB)
Collecting build>=1.0.3 (from chromadb)
  Downloading build-1.2.2.post1-py3-none-any.whl.metadata (6.5 kB)
Collecting chroma-hnswlib==0.7.6 (from chromadb)
  Downloading chroma_hnswlib-0.7.6-cp311-cp311-win_amd64.whl.metadata (262 bytes)
Collecting fastapi>=0.95.2 (from chromadb)
  Downloading fastapi-0.115.7-py3-none-any.whl.metadata (27 kB)
Collecting uvicorn>=0.18.3 (from uvicorn[standard]>=0.18.3->chromadb)
  Downloading uvicorn-0

  You can safely remove it manually.
ERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
streamlit 1.30.0 requires packaging<24,>=16.8, but you have packaging 24.2 which is incompatible.
streamlit 1.30.0 requires protobuf<5,>=3.20, but you have protobuf 5.29.3 which is incompatible.
streamlit 1.30.0 requires tenacity<9,>=8.1.0, but you have tenacity 9.0.0 which is incompatible.


In [3]:
!pip install -U langchain-community

Collecting langchain-community
  Downloading langchain_community-0.3.16-py3-none-any.whl.metadata (2.9 kB)
Collecting dataclasses-json<0.7,>=0.5.7 (from langchain-community)
  Downloading dataclasses_json-0.6.7-py3-none-any.whl.metadata (25 kB)
Collecting httpx-sse<0.5.0,>=0.4.0 (from langchain-community)
  Downloading httpx_sse-0.4.0-py3-none-any.whl.metadata (9.0 kB)
Collecting pydantic-settings<3.0.0,>=2.4.0 (from langchain-community)
  Downloading pydantic_settings-2.7.1-py3-none-any.whl.metadata (3.5 kB)
Collecting marshmallow<4.0.0,>=3.18.0 (from dataclasses-json<0.7,>=0.5.7->langchain-community)
  Downloading marshmallow-3.26.0-py3-none-any.whl.metadata (7.3 kB)
Collecting typing-inspect<1,>=0.4.0 (from dataclasses-json<0.7,>=0.5.7->langchain-community)
  Downloading typing_inspect-0.9.0-py3-none-any.whl.metadata (1.5 kB)
Downloading langchain_community-0.3.16-py3-none-any.whl (2.5 MB)
   ---------------------------------------- 0.0/2.5 MB ? eta -:--:--
   ----------------------

In [1]:
# CHROMOA
from langchain.vectorstores import Chroma
from langchain.embeddings import SentenceTransformerEmbeddings
from langchain.schema import Document
from ollama import chat
import os
import re

DOCUMENT_PATHS = [
    r'C:\Users\ASUS\Downloads\Hamrah.txt', #replace path
    r'C:\Users\ASUS\Downloads\vape.txt',
    r'C:\Users\ASUS\Downloads\Shah.txt',
    r'C:\Users\ASUS\Downloads\Khalife.txt',
    r'C:\Users\ASUS\Downloads\carbon.txt',
    r'C:\Users\ASUS\Downloads\takapoo.txt'
]

EMBEDDING_MODEL = 'sentence-transformers/paraphrase-multilingual-mpnet-base-v2'
LLM_MODEL = 'partai/dorna-llama3'
CHUNK_SIZE = 1000
OVERLAP = 200
CHROMA_PERSIST_DIR = r'C:\Users\ASUS\Downloads\chroma_db'  

class ChromaRAGSystem:
    def __init__(self):
        # Init embedding model
        self.embeddings = SentenceTransformerEmbeddings(model_name=EMBEDDING_MODEL)
        # Vector store instance
        self.vector_db = None
        
    def build_vector_store(self):
        """Process documents and create Chroma vector store"""
        all_docs = []
        

        for doc_idx, path in enumerate(DOCUMENT_PATHS):
            with open(path, 'r', encoding='utf-8') as f:
                text = re.sub(r'\s+', ' ', f.read()).strip()
                # sliding window chunking
                chunks = [
                    text[i:i+CHUNK_SIZE] 
                    for i in range(0, len(text), CHUNK_SIZE - OVERLAP)
                ]
                # LangChain documents with metadata
                for chunk in chunks:
                    all_docs.append(Document(
                        page_content=chunk,
                        metadata={"source_doc": doc_idx}
                    ))
        
        # Chroma vector store
        self.vector_db = Chroma.from_documents(
            documents=all_docs,
            embedding=self.embeddings,
            persist_directory=CHROMA_PERSIST_DIR
        )
        self.vector_db.persist()
        
    def load_vector_store(self):
        """Load existing Chroma vector store"""
        self.vector_db = Chroma(
            persist_directory=CHROMA_PERSIST_DIR,
            embedding_function=self.embeddings
        )
        
    def document_query(self, query, doc_index, top_k=5):
        """Retrieve context from specific document"""
        # Chroma metadata filtering
        results = self.vector_db.similarity_search(
            query=query,
            k=top_k,
            filter={"source_doc": doc_index}
        )
        return [doc.page_content for doc in results]

class AnswerGenerator:
    def __init__(self, rag_system):
        self.rag = rag_system
        
    def generate_response(self, question, doc_index):
        """Generate context-aware answer using LLM"""
        # Retrieve relevant context
        context_chunks = self.rag.document_query(question, doc_index)
        context = "\n".join(context_chunks)
        
        prompt = f"""با استفاده از متن زیر به سوال پاسخ دهید:
{context}

اگر پاسخ در متن وجود ندارد عبارت 'پاسخی یافت نشد' را برگردانید

سوال: {question}
پاسخ:"""
        
        response = chat(model=LLM_MODEL, messages=[{'role': 'user', 'content': prompt}])
        return response['message']['content']

if __name__ == "__main__":
    rag_system = ChromaRAGSystem()
    
    # Init vector store
    if not os.path.exists(CHROMA_PERSIST_DIR):
        print("Creating new vector store...")
        rag_system.build_vector_store()
    else:
        print("Loading existing vector store...")
        rag_system.load_vector_store()
    
    # Init answer generator
    answer_engine = AnswerGenerator(rag_system)

    queries = [
        ("چرا اینترنت همراه اول گوشی وصل نمیشود؟", 0),
        ("چطوری ویپ مورد نظرمو پیدا کنم؟", 1),
        ("شاه عباس که بود؟", 2),
        ("خلیفه سلطان که بود و چه کرد؟", 3),
        ("کربن اکتیو و کربن بلک چه هستند و چه تفاوتی دارند و برای چه استفاده میشن؟", 4),
        ("شرکت تکاپو صنعت نامی چه محصولاتی ارایه میدهد؟ چه چیزی این شرکت را منحصر به فرد میسازد؟ سهام این شرکت صعودی است یا نزولی؟", 5)
    ]
    
    with open(r'C:\Users\ASUS\Downloads\representation2.txt', 'w', encoding='utf-8') as output_file: #repalce path
        for q_num, (query, doc_idx) in enumerate(queries):
            answer = answer_engine.generate_response(query, doc_idx)
            output_file.write(f"سوال {q_num+1} ({doc_idx+1}):\n{query}\n\nپاسخ:\n{answer}\n\n{'='*50}\n\n")
            print(f"پردازش سوال {q_num+1}/{len(queries)} تکمیل شد")

print("تمامی سوالات با موفقیت پردازش شدند!")

  self.embeddings = SentenceTransformerEmbeddings(model_name=EMBEDDING_MODEL)


Loading existing vector store...


  self.vector_db = Chroma(


پردازش سوال 1/6 تکمیل شد
پردازش سوال 2/6 تکمیل شد
پردازش سوال 3/6 تکمیل شد
پردازش سوال 4/6 تکمیل شد
پردازش سوال 5/6 تکمیل شد
پردازش سوال 6/6 تکمیل شد
تمامی سوالات با موفقیت پردازش شدند!
