RAG

Overview

This Streamlit application enables users to upload PDF documents and perform question-answering using advanced retrieval and language model techniques.

Key Components

1. Document Processing

Function: process_document()
Purpose: Converts uploaded PDF files into text chunks
Features:
- Uses PyMuPDFLoader for PDF parsing
- Applies RecursiveCharacterTextSplitter for text segmentation
- Handles temporary file management
- Chunk size: 400 characters
- Chunk overlap: 100 characters

2. Vector Storage

Database: ChromaDB
Embedding Model: Snowflake Arctic Embed2
Features:
- Persistent vector storage
- Cosine similarity search
- Metadata tracking for document chunks

3. Retrieval Process

Retrieval Steps:
1. Query vector collection
2. Cross-encoder re-ranking
3. Select top 3 most relevant document chunks

4. Language Model Interaction

Model: LLaMA 3.2
Prompt Engineering:
- System prompt guides structured, context-based responses
- Ensures answer generation based solely on provided context

Key Functions

`get_vector_collection()`

Initializes ChromaDB collection
Configures Ollama embedding function
Sets up cosine similarity space

`add_to_vector_collection()`

Adds document chunks to vector store
Generates unique IDs based on filename
Stores document metadata

`query_collection()`

Performs semantic search in vector collection
Retrieves most relevant documents

`re_rank_cross_encoders()`

Uses MS MARCO MiniLM cross-encoder
Re-ranks retrieved documents
Selects top 3 most relevant chunks

`call_llm()`

Streams responses from LLaMA 3.2
Applies system prompt for structured answering

User Interface

Sidebar for PDF upload
Main area for question input
Streaming response display
Expandable sections for retrieved documents

Dependencies

Streamlit
ChromaDB
Ollama
PyMuPDFLoader
Sentence Transformers
LangChain

Setup Requirements

Install dependencies
Ensure Ollama is running locally
Download required embedding and language models

Potential Improvements

Add error handling
Implement multi-document support
Create model configuration options
Add citation/source tracking

Security Considerations

Temporary file management
Handling file upload permissions
Secure embedding and model usage

Performance Optimization

Chunk size and overlap tuning
Model selection
Caching mechanisms

Usage Example

Upload a PDF document
Click "Process"
Ask questions about the document
Receive AI-generated answers based on document context

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

RAG

Overview

Key Components

1. Document Processing

2. Vector Storage

3. Retrieval Process

4. Language Model Interaction

Key Functions

`get_vector_collection()`

`add_to_vector_collection()`

`query_collection()`

`re_rank_cross_encoders()`

`call_llm()`

User Interface

Dependencies

Setup Requirements

Potential Improvements

Security Considerations

Performance Optimization

Usage Example

About

Uh oh!

Releases

Packages

Uh oh!

Languages

DAXXY-777/Simple-QA-RAG

Folders and files

Latest commit

History

Repository files navigation

RAG

Overview

Key Components

1. Document Processing

2. Vector Storage

3. Retrieval Process

4. Language Model Interaction

Key Functions

get_vector_collection()

add_to_vector_collection()

query_collection()

re_rank_cross_encoders()

call_llm()

User Interface

Dependencies

Setup Requirements

Potential Improvements

Security Considerations

Performance Optimization

Usage Example

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

`get_vector_collection()`

`add_to_vector_collection()`

`query_collection()`

`re_rank_cross_encoders()`

`call_llm()`

Packages