Spaces:

mbudisic
/

PsTuts-RAG

Sleeping

App Files Files Community

PsTuts-RAG / app_simple_rag.py

mbudisic

dev: simplifying datastore functions

3b978ee 5 months ago

raw

history blame

3.68 kB

	import asyncio
	import json
	import os
	from dataclasses import dataclass
	from typing import Any, Dict, List

	import chainlit as cl
	from dotenv import load_dotenv
	from langchain_core.documents import Document
	from langchain_core.language_models import BaseChatModel
	from langchain_core.runnables import Runnable
	from langchain_openai import ChatOpenAI
	from langchain_openai.embeddings import OpenAIEmbeddings
	from langchain_qdrant import QdrantVectorStore
	from qdrant_client import QdrantClient

	import pstuts_rag.datastore
	import pstuts_rag.rag
	from pstuts_rag.datastore import load_json_files


	@dataclass
	class ApplicationParameters:
	filename = [f"data/{f}.json" for f in ["dev"]]
	embedding_model = "text-embedding-3-small"
	n_context_docs = 2
	llm_model = "gpt-4.1-mini"


	def set_api_key_if_not_present(key_name, prompt_message=""):
	if len(prompt_message) == 0:
	prompt_message = key_name
	if key_name not in os.environ or not os.environ[key_name]:
	os.environ[key_name] = getpass.getpass(prompt_message)


	class ApplicationState:
	embeddings: OpenAIEmbeddings = None
	docs: List[Document] = []
	qdrant_client: QdrantClient = None
	vector_store: QdrantVectorStore = None
	datastore_manager: pstuts_rag.datastore.DatastoreManager
	rag_factory: pstuts_rag.rag.RAGChainFactory
	llm: BaseChatModel
	rag_chain: Runnable

	hasLoaded: asyncio.Event = asyncio.Event()
	pointsLoaded: int = 0

	def __init__(self) -> None:
	load_dotenv()
	set_api_key_if_not_present("OPENAI_API_KEY")


	state = ApplicationState()
	params = ApplicationParameters()


	async def fill_the_db():
	if state.datastore_manager.count_docs() == 0:
	data: List[Dict[str, Any]] = await load_json_files(params.filename)
	state.pointsLoaded = await state.datastore_manager.embed_chunks(
	raw_docs=data
	)
	await cl.Message(
	content=f"✅ The database has been loaded with {state.pointsLoaded} elements!"
	).send()


	async def build_the_chain():
	state.rag_factory = pstuts_rag.rag.RAGChainFactory(
	retriever=state.datastore_manager.get_retriever()
	)
	state.llm = ChatOpenAI(model=params.llm_model, temperature=0)
	state.rag_chain = state.rag_factory.get_rag_chain(state.llm)
	pass


	@cl.on_chat_start
	async def on_chat_start():
	state.qdrant_client = QdrantClient(":memory:")

	state.datastore_manager = pstuts_rag.datastore.DatastoreManager(
	qdrant_client=state.qdrant_client, name="local_test"
	)
	asyncio.run(main=fill_the_db())
	asyncio.run(main=build_the_chain())


	@cl.on_message
	async def main(message: cl.Message):
	# Send a response back to the user
	msg = cl.Message(content="")
	response = await state.rag_chain.ainvoke({"question": message.content})

	text, references = pstuts_rag.rag.RAGChainFactory.unpack_references(
	response.content
	)
	if isinstance(text, str):
	for token in [char for char in text]:
	await msg.stream_token(token)

	await msg.send()

	references = json.loads(references)
	print(references)

	msg_references = [
	(
	f"Watch {ref["title"]} from timestamp "
	f"{round(ref["start"] // 60)}m:{round(ref["start"] % 60)}s",
	cl.Video(
	name=ref["title"],
	url=f"{ref["source"]}#t={ref["start"]}",
	display="side",
	),
	)
	for ref in references
	]
	await cl.Message(content="Related videos").send()
	for e in msg_references:
	await cl.Message(content=e[0], elements=[e[1]]).send()


	if __name__ == "__main__":
	main()