본문 바로가기
AI/라마 파인튜닝

(a) 데이터셋

by 잘먹는 개발자 에단 2024. 12. 5.

데이터셋이 가장 문제였는데, 생각보다 쉽게 해결되었다.

 

한국언론진흥원에서 뉴스 데이터를 훈련/검증용을 분리까지 해놔서 올려놨다. 

심지어, 용도에 따른 분류까지 다 해놨다. 

이렇게 되면 다음이 가능하다.

 

본문을 통해서 제목을 생성해주는 어시스턴트

개별 기사에 대한 질문을 받아주는 어시스턴트

등등 여러 구상이 가능해졌다. 

'AI > 라마 파인튜닝' 카테고리의 다른 글

학습 방법론  (1) 2024.12.05
(5) 학습진행 - 2  (0) 2024.12.05
(4) 학습진행 - 1  (0) 2024.12.05
(2) 필요한 라이브러리 세팅  (0) 2024.12.05
(1) 큰 과정  (1) 2024.12.05