데이터셋이 가장 문제였는데, 생각보다 쉽게 해결되었다.
한국언론진흥원에서 뉴스 데이터를 훈련/검증용을 분리까지 해놔서 올려놨다.
심지어, 용도에 따른 분류까지 다 해놨다.
이렇게 되면 다음이 가능하다.
본문을 통해서 제목을 생성해주는 어시스턴트
개별 기사에 대한 질문을 받아주는 어시스턴트
등등 여러 구상이 가능해졌다.
'AI > 라마 파인튜닝' 카테고리의 다른 글
학습 방법론 (1) | 2024.12.05 |
---|---|
(5) 학습진행 - 2 (0) | 2024.12.05 |
(4) 학습진행 - 1 (0) | 2024.12.05 |
(2) 필요한 라이브러리 세팅 (0) | 2024.12.05 |
(1) 큰 과정 (1) | 2024.12.05 |