您将在浏览器内使用一个拥有 15 亿参数的大语言模型 DeepSeek-R1-Distill-Qwen-1.5B,全部推理过程都将通过 🤗 Transformers.js 和 ONNX Runtime Web 调用浏览器提供的 WebGPU API 在本地完成,推理过程中不会向服务器端传递任何数据。网页加载完毕后,即使在离线情况下您也能使用该网页进行大语言模型的推理。模型加载完毕后将会缓存在浏览器中,这样在您下次使用时将不再需要重复加载模型文件。本项目由 GitHub 开源项目改编而成。
免责声明:生成的内容可能是假的或是不准确的。
使用条款