
이전 글 : http://janggiraffe.tistory.com/43420250402_LangChain과 Chroma를 활용한 RAG 구성- 우리가 할 것1. 문서의 내용을 읽는다.2. 문서를 쪼갠다 - 그 이유는 토큰 수 초과로 답변생성 못할 수 있음 - 문서가 길면 (인풋이 길면) 답변 생성이 오래걸림3. 임베딩 -> 벡터 데이터베이스에 저장4. 질문이 있을 떄 백터 데이터베이스에 유사도 검색5. 유사도 검색으로 가져온 문서를 LLM 질문과 같이 전달RAG를 구성할 문서 가져오기한글 문서라면 docx(Ward)를 추천하던데 그 이유는 pdf는 줄이 나뉘어지면서 단어가 끊기면 한단어라도 다른단어로 인식한다고 함.https://law.go.kr/%EB%B2%95%EB%A0%B9/%EC%86%8C%..