好消息!今天才发现本地的Ollama可以调用云上的模型了,目前有四款模型可以免费使用,只需注册一个Ollama账号即可使用。本地部署的小模型cnshenyang/qwen3-nothink:30b
只能达到7-8 tokens/s,看来没什么用处了(目前还可以审阅发文内容)。反正在线的模型能用多久就用多久吧。
Ollama 云模型
站点水印:www.onemuggle.com
使用教程
- 打开
https://ollama.com/
点击Download
下载,然后进行安装 - 打开
https://ollama.com/signup
注册 Ollama 账号 - 注册成功后,也可以打开
https://ollama.com/settings/keys
自行添加keys
- 打开安装好的Ollama 软件,点击左侧菜单中的 设置按钮
- 打开设置面板后,点击
Sign In
,会跳转到浏览器页面,登录账号后点击Connect
- 目前官网提供了四个模型,如果找不到,可以在模型选择框中搜索(可复制模型名称进行搜索)
gpt-oss:20b-cloud
gpt-oss:120b-cloud
deepseek-v3.1:671b-cloud
qwen3-coder:480b-cloud
测试效果
本地模型
- 本地部署的
cnshenyang/qwen3-nothink:30b
,这个模型是去除推理的,速度勉勉强强能接受,目前在使用的离线版模型。
云模型
- 感觉
gpt-oss:120b-cloud
更好用一些,下面是通过该模型生成的小游戏 - 生成的游戏(点击直接运行):snake.html