错误 AssertionError: Torch not compiled with CUDA enabled 的核心含义是:你安装的 PyTorch 版本不支持 CUDA(显卡加速),但 Qwen3-TTS 代码默认尝试使用 GPU 运行,导致初始化失败。
在对话中就能直接让模型搜索最新信息
Ollama 在 2026 年 3 月 15 日发布的 0.18.1 版本中,已经内置了网页搜索与抓取插件,能让本地大语言模型获得联网搜索能力。使用时启用 web search 插件,比如执行 “ollama serve --enable-web-search” 命令即可。
Ollama官网下载Windows安装包,双击按提示安装就行,安装后会自动配置环境变量。打开PowerShell或命令提示符,输入“ollama --version”能看到版本号就说明安装成功了。
模型参数量
这里的“1.7B”和“0.6B”指的是模型的参数量,“B”是“Billion”的缩写,也就是10亿。1.7B就是17亿参数,0.6B就是6亿参数。参数量越大,模型通常能学习到更复杂的模式,但对计算资源的要求也更高。
部署大模型应用遇到的相关问题
docker 运行的问题:
error during connect: Get "http://%2F%2F.%2Fpipe%2FdockerDesktopLinuxEngine/v1.51/images/deer-flow-dev-frontend/json": open //./pipe/dockerDesktopLinuxEngine: The system cannot find the file specified.
报错原因是未启动 docker desktop
qwen-3-tts
启动服务遇到的问题:
- python 环境问题:机器上使用 pip 命令时报错找不到位置,看路径,使用的是之前从 ms store 安装的 Python313。排查一番,发现原来是
%USERPROFILE%\AppData\Local\Programs\Python\Python310\Scripts这个目录下的文件不对,居然有 3.13 ,可能是之前病急乱投医放的。 另外发现,vscode 会配置虚拟 python 环境 venv,不知道原理如何 - torch 问题:可能默认安装的是 cpu 的 torch,要卸载后重新安装 cu128
tts 试用体验
- 中年男声,沉稳、大气、正式、中低音,慢节奏,叙事感强,史诗感。
- 宏伟大气的中年男声,中低音,慢节奏,纪录片腔
- 沉稳的中年男声,中低音,慢节奏,纪录片腔
- todo: 下载 tts pro
修改百度账号
网盘账号:一个手机可以绑定 5 个 百度账号,设备需要登录3天才能修改百度账号
- 落叶知秋 liqiu
- 王为恶韩明威

