Similarity-Search-Python

Similarity search in Python involves reading pdf, convert text into numerical vectors (embeddings) and then find the closest vectors to a given query based on similarity search using numpy library.

General Workflow

Data Ingestion

Load Data: Read the PDF and get the text contents
Generate Embeddings: Convert the text chunks into numerical vectors using an embedding model (e.g., Google GEN-AI).

Query Processing

Perform Search: When a user provides a query, convert the query into an embedding, and search the vector store to find the nearest neighbors (most similar results).

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
static-files		static-files
.gitignore		.gitignore
README.md		README.md
chunk_data.py		chunk_data.py
data_ingestion.py		data_ingestion.py
env_utils.py		env_utils.py
genai_utils.py		genai_utils.py
main.py		main.py
query_processing.py		query_processing.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Similarity-Search-Python

General Workflow

Data Ingestion

Query Processing

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Similarity-Search-Python

General Workflow

Data Ingestion

Query Processing

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages