AI/라마 파인튜닝
(a) 데이터셋
잘먹는 개발자 에단
2024. 12. 5. 09:56
데이터셋이 가장 문제였는데, 생각보다 쉽게 해결되었다.
한국언론진흥원에서 뉴스 데이터를 훈련/검증용을 분리까지 해놔서 올려놨다.
심지어, 용도에 따른 분류까지 다 해놨다.
이렇게 되면 다음이 가능하다.
본문을 통해서 제목을 생성해주는 어시스턴트
개별 기사에 대한 질문을 받아주는 어시스턴트
등등 여러 구상이 가능해졌다.