카테고리 없음 (6) fastAPI 를 통한 모델 서빙 잘먹는 개발자 에단 2024. 12. 5. 09:54 [LLM] llama3.1을 vllm API를 통해 서빙해보자. (feat. FastAPi) - 미완성의신