← 返回全部文章

Show HN: Tiny-vLLM – high performance LLM inference engine in C++ and CUDA

摘要
暂无摘要
主题
AI新技术/新模型
评分
6
来源
Hacker News Show HN
标签
#LLM推理引擎#C++/CUDA#开源项目