1. llama, eeve 한국어 훈련된 모델을 가져와서 가지고 있는 기사데이터를 학습시킨다.
2. llama, eeve 한국어 훈련된 모델을 가지고 와서 외신 기사 데이터를 학습시킨다. 그 후에 미세조정한다.
- 이 방법은 거의 불가능하다고 보면 될 듯. 외신의 기사와 한국의 기사 제목이 너무 다르다.
3. gpt-4 모델에 데이터셋 학습과 미세조정만을 계속 반복해서 실시한다. ( 완료 )
4. 베이스 모델에 이미 기사 제목을 달도록 만들어진 모델에 한국어를 학습시킨다.
기사 제목 생성 모델 ( eng )
czearing/article-title-generator at main
seu5022/Llama-3.1-8B-pre-trained-mixed-korean-articles · Hugging Face
'AI > 라마 파인튜닝' 카테고리의 다른 글
(a) 데이터셋 (0) | 2024.12.05 |
---|---|
(5) 학습진행 - 2 (0) | 2024.12.05 |
(4) 학습진행 - 1 (0) | 2024.12.05 |
(2) 필요한 라이브러리 세팅 (0) | 2024.12.05 |
(1) 큰 과정 (1) | 2024.12.05 |