使用Docker在Orange Pi上LLM（使用GPU加速）

最初买 Orange Pi 5 的目的之一就是想跑一些 AI 应用。Orange Pi 5 虽带了 NPU，但这颗 NPU 实在太小众，除了官方的 Demo 就没法轻松把 NPU 用起来。近期看到有人用 RK3588 跑LLM，于是把吃灰已久的 Orange Pi 5 拿出来折腾。

Orange Pi 5 使用的是 RK3588 芯片，该芯片配备的 GPU 是 Mali-G610。在 Orange Pi 5 上跑 LLM 用的就是这颗 GPU 。

基本用法

LLM 模型通过 MLC LLM 项目加载运行。在 Orange Pi 5 上通过 OpenCL 实现 GPU 加速，因此要求系统支持 OpenCL 。Orange Pi 5 的官方 Linux 镜像已添加了 OpenCL 支持，因此不用再额外安装驱动。

如果 Orange Pi 5 上已经安装了 Docker 可以使用下面的命令把服务跑起来。7b-f16 的模型会用到 6.xG 的内存，如果你的系统只有4G内存可以试试 3b-f16 的模型。

# 更多镜像见 https://hub.docker.com/r/vicalloy/mlc-llm-rk3588/tags
docker run --rm -it --privileged \
    vicalloy/mlc-llm-rk3588:FlagAlpha-Llama2-Chinese-7b-Chat-q4f16_1

编译自己的Docker镜像

rock5-toolchain 项目中提供了 MLC LLM 的 Dockerfile ，可以通过修改 Dockerfile 里的 ARG MODEL 来打包不同的模型。

为了更方便的打包不同的模型，更为了白嫖 Github Actions 服务器，我参考 rock5-toolchain 项目写了自己的 Dockerfile。相比原始的 Dockerfile，我把TVM编译/G610驱动安装等步骤打包在镜像 vicalloy/mlc-llm-rk3588:base 预置 model 的镜像从该镜像继承。要预置不同的模型，只要将对应的模型复制到镜像就好。

对应项目地址：https://github.com/vicalloy/docker-images/tree/main/mlc-llm-rk3588

参考链接：

京东云无线宝（OpenWrt）控制终端定时断网

最近将家里的路由器从 小米 换成了 京东云无线宝 。换完后发现新路由器不支持设备的定时断网了。对于有小朋友的家庭，定时断网可以很好的帮助小朋友控制上网时间。好在新入的这款路由器基于 OpenWrt 开发，经过几天的研究，顺利的搞定了定时断网功能。

开启路由器的SSH

注：2023-10 近期路由器被自动升级了。网上的开门方法全部失效，只能尝试TTL开门了。

开始折腾的第一步是搞定路由器的SSH。SSH登录到路由器后就可以随意折腾了。

由于京东云官方的封堵，不同版本固件的SSH开启方式有所不同。

我拿到的这台路由器的固件版本很老，直接采用第一个方法开启SSH。具体方法如下：

登录京东云，打开f12控制台，将下面的代码贴入浏览器控制台并运行。

$.ajax({
    url: "/jdcapi",
    async: false,
    data: JSON.stringify({
        jsonrpc: "2.0",
        id: 1,
        method: "call",
        params: [
            $.cookie("sessionid"),
            "service",
            "set",
            {
                "name": "dropbear",
                "instances": {"instance1": {"command": ["/usr/sbin/dropbear"]}}
            }
        ]
    }),
    dataType: "json",
    type: "POST"
})

设备定时断网方案

OpenWrt系统通常自带 web 管理界面 LuCI ，即使没带也可自行安装。如果有 LuCI ，通过 LuCI 丰富的插件系统，可以轻松的实现上网时间的管控。

京东的这款路由器毕竟不是完整的OpenWrt系统，无法直接安装 LuCI 。为了设备的稳定性，保险起见没有继续折腾 LuCI 。研究后发现京东云路由器的自带的黑明单功能是通过修改设备 /etc/config/wireless 配置文件实现，于是有了下面的方案。

使用 uci 命令修改 wireless 配置文件，将需要管控的设备加入/移出 Wi-Fi 黑明单。
使用 crontab 创建定时任务，实现定时控制。
在路由器的黑明单中无法查看到通过修改 wireless 加入黑明单的设备。但可以通过将设备加入黑名单再移除的方式对设备进行临时解禁。

具体操作步骤

登录路由器

开始路由器的 SSH 登录功能，使用 SSH 客户端登录路由器。用户名为 root ，密码为路由器的管理密码。

ssh root@jdcloudwifi.com

创建将设备加入黑明单的相关脚本

1. 创建目录 /scripts 。我们自己的脚本都将放到该目录。

mkdir -p /scripts 
cd /scripts

2. 将下列脚本复制到 /scripts 目录，并使用命令 chmod +x /scripts/*.sh 为脚本添加可执行权限。

disable-wifi.sh

#!/bin/sh
# 禁止设备连接 Wi-Fi
# 使用 `cat /etc/config/wireless` 查看无线配置。通过 `option ssid` 找到对应的 Wi-Fi 配置项名称。注： 2.4G 和 5G 两个热点都需要配置。 
uci add_list wireless.ath0.maclist="$1"
uci add_list wireless.ath1.maclist="$1"
uci commit wireless
wifi reload

enable-wifi.sh

#!/bin/sh
# 允许设备连接 Wi-Fi
uci del_list wireless.ath0.maclist="$1"
uci del_list wireless.ath1.maclist="$1"
uci commit wireless
wifi reload

disable-tv.sh

#!/bin/sh
# 将 dd:dd:dd:dd:dd:dd 换成需要加入黑名单的设备的 MAC 地址
/scripts/disable-wifi.sh dd:dd:dd:dd:dd:dd

enable-tv.sh

#!/bin/sh
/scripts/enable-wifi.sh dd:dd:dd:dd:dd:dd

3. 执行 crontab -e 编辑系统定时任务。

# 周一到周五，8点关闭电视网络
0 8 * * 1-5 /scripts/disable-tv.sh
# 周一到周五，18点开启电视网络
0 18 * * 1-5 /scripts/enable-tv.sh

九寨沟-若尔盖-四姑娘山

考虑到直飞九寨沟的机票较贵，开车从成都到九寨沟时间又太长，最终选择了飞到九寨沟，再从九寨沟自驾回成都。
相比走环线，异地还车可以节约不少时间，加上减免了异地还车费用，算是个不错的选择。

杭州->成都->黄龙->九寨沟

雨季的九寨沟，天气难料。由于天气原因，一直无法确定飞机的起飞时间。最后晚点3个小时，后半夜到达黄龙机场。

黄龙机场修建在山上，海拔3447。最近的住宿点在12公里外的镇上。深夜到达早过了取车时间，花¥80打车到川主寺镇住宿，第二天又花¥60打车回机场取车。

机场附近有大片的薰衣草，如果时间充足，可以留些时间赏花。

黄龙->九寨沟

第二天一早取车自驾到九寨沟。

九寨沟很美。不过或许是因为对九寨沟有着过高的期待，并没有惊艳。

九寨沟->若尔盖->红原

刚出发的一段沿着河谷行走，两旁是陡峭的崖壁，偶有塌方的痕迹。感谢遇上了个好天气，要是遇上雨天，想必会挺危险。

用手机测了一下九若山垭口的海拔3988。一路的盘山公路。不知是高反还是晕车，车上的一大一小都给晃吐了，以至路上的风景都无心欣赏。

翻过垭口，开始进入若尔盖草原。初夏或许是草原最美的季节，草很绿，上面还开着各色的野花。

红原算是一路上比较大的镇子，镇上停车方便住宿条件还不错，价格也便宜。

红原->四姑娘山->理县

四姑娘山景区主要有三个沟可以游览。出发前还想着要选哪个，回头查了一下才知道根本就没得选。除了毕棚沟，另外两个沟都在四姑娘山的另外一面，要多开好几个小时才能到。

在看过雨崩和亚丁稻城的雪山后，四姑娘山的雪山真的太普通了。水不够漂亮，山上的雪很少，可接近性也不行，到不了雪线。四姑娘山唯一的优点可能就是离成都比较近。

晚上住在理县。理县处于两山峡谷间，土地非常珍贵，导致几乎找不到停车位。即使是酒店也只能提供非常有限的停车位。

理县->成都->杭州

初夏的成都已经很热了，不适合出游。在成都人民公园简单的转了一下就直接出发去机场了。市区严重堵车，驾驶体验非常不好。

Magpie 股价价格提醒工具

项目地址：https://github.com/vicalloy/magpie/

股票工具。设置股票的止损点和营收点，在到达止损点或营收点时发起消息推送。提供一个简易点web服务器用于查看相关股票的当前价格。

注：

支持的推送平台有 Telegram / Bark 。

用法

编辑规则文件

提醒规则使用 Json 格式进行描述。编辑规则并保存为文件 rule.json 。

[
  {
    "stock_code": "sh000001",
    "stock_name": "上证指数",
    "base_price": 3200,  # 基准价格，用于计算涨幅
    "alarm_price_min": 3100,  # 止损点
    "alarm_price_max": 3400  # 营收点
  },
  {
    "stock_code": "sz000333",
    "stock_name": "美的",
    "base_price": 54,
    "alarm_percentage_min": 0.15,  # 止损点 base_price * (1 - alarm_percentage_min)
    "alarm_percentage_max": 0.15  # 营收点 base_price * (1 + alarm_percentage_max)
  },
]

启动 Web 服务器

docker run --rm \
    -v `pwd`/rules.json:/app/rules.json \
    -p 8000:8000 vicalloy/magpie:latest \
    python -m magpie server -r ./rules.json

在浏览器中访问网址 http://localhost:8000/ 。

检查股价

docker run --rm \
    -v `pwd`/rules.json:/app/rules.json \
    magpie:latest \
    python -m magpie check -r ./rules.json \
    --datasource qq \
    --bark-token $(bark-token) \
    --tg-token $(tg-token) \
    --tg-chat-id $(tg-chat-id)

可以通过设置 crontab 的方式定时执行股价的检查。

备注

使用 Bark
- 请在 iPhone 上安装 Bark 客户端，并获取对应的 Token 。
Using Telegram
- 创建一个 Bot 并获取对应的 Bot token
- 创建一个 Group ，并将刚创建的 Bot 添加到该Group，然后获取 Group 对应的 chat id.
  - 例如: https://web.telegram.org/a/#-1045009696 -1045009696 就是 chat id.

10 9,10,11,12,13,14 * * * sudo docker run ....

越来越分裂的世界

感觉近几年整个世界都在变的越来越分裂。

美国传统精英和特朗普代表的“铁锈”直接的对立。
美国的政治正确。注：游戏和电影角色越来越丑。
中国的 5 毛党和恨国党。
中国的女拳。

世界分裂可能由下面一些原因共同产生

全球经济不景气。经济快速发展，大家都有钱赚的时候什么问题都容易掩盖。目前中美的发展都遇到了瓶颈。中国要打破瓶颈就必须触碰到美国目前牢牢把握的高科技以及金融霸权。从美国到角度则必须遏制中国的进一步发展。
上网的人变多来，发声的人变多。之前上网有门槛，上网这件事本身就完成了一轮人员筛选。更少的人更容易达成共识。
个性化推荐的大行其道，更易形成“信息茧”。人们在各自的“信息茧”里不断强化自己的共识。

就我的感觉，当前中国确实有很多问题（比如过分依赖土地财政等）。这些问题涉及多方势力的博弈，甚至这些问题最终能否妥善解决还是暴雷都存在一定不确定性。单总体而言中国整体还是向上的。

空气质量整体改善，雾霾天比之前少了很多。
中国在高端制造业上开始发力。也曾很看不上华为出的手机芯片，却不想华为一步步做到里高端。如果不是美国的制裁，华为的手机芯片还会有更好的发展。
曾在公司做过几年信息化。从接触到的信息来看，中国对公司的审计每一年都比前一年要更严格。政府也在推动公司的信息化。信息后的结果是信息变的非常透明，不规范的操作变的很难隐藏。

谨慎的乐观的看 Modular 提出的 Mojo 语言

有了 faster-cpython 的前车之鉴，对 Mojo 谨慎的乐观。

宣称将成为 Python 的超集是 Mojo 相比 Codon 等项目最吸引人的一点。Codon类项目虽然宣称是Python的编译器，但实际上砍掉了 Python 所有的动态特性，几乎所有的 Python 库都无法正常使用。对我而言，如果用不了 Python 生态，那这和一个全新的语言又有什么区别。

如果 Mojo 真成为Python的超集，单就比 CPython 性能高出一大截的 Python 编译器就足够吸引人。但细看下来，“成为 Python 超集”可能只是一个美好的愿望，达成的可能性非常小。现在 Mojo 的完成度还非常低，除了支持 Python 风格的语法外，Python还差很远（连 Class 都不支持）。现在版本的 Mojo 支持导入 Python 模块，但导入的 Python 模块是以 Python 对象的方式运行。换句话说就是塞了个 CPython 解释器到 Mojo 里用来执行 Python 代码（是不是立马不高大上了）。

除去 Mojo 吹牛的部分（比如那个比 Python 快 3500 倍），对 Mojo 还是有所期待。Mojo 的创始人有着牛逼哄哄的履历（LLVM & Swift 的作者）。虽然不能完全兼容 Python ，但承诺后期会提供相关的迁移工具。如果 Mojo 的性能和开发体验确实不错，Python库的迁移成本不高，还是会有不少人会自发的将 Python 生态迁移到 Mojo 到。

注：

faster-cpython 最初的目标是5年内5倍的性能提升。目前时间已经过去了2年，性能只提升了不到30%。照这样的情形看5年内最终性能能翻倍都挺难。
Is the relationship between Mojo and Python is similar to TypeScript/Javascript or Kotlin/Java?

一个AI公司需要多少人

Stable Diffusion 和 ChatGPT 的大火，让沉寂已久的AI世界再次翻红。又开始有人在问，在AI越来越成熟的今天，程序员是否有必要去学算法，投身AI行业。在我看来对程序员而言AI带来的机会更多是如何利用AI带来的能力而不是去创造一个AI。

曾在AI公司待过一段时间，这段经历给我最大的感觉是： AI 行业是一个资本密集型产业，对普通程序员来说没太多的机会。AI的发展对普通程序员带来的最大变化是出现来一批很好用的 API ，可以实现一些以前实现不了的想法。另外就是如何利用新出现的一批AI工具提高自己的工作效率。

为什么不建议普通程序员进入AI行业

简单来说AI行业需要的专业算法人员非常少，且门槛非常高。非算法相关的人员，相对而言门槛又太低。

常规应用，通用模型已经很成熟了。对于 99.9%人根本不可能构建出一个比开源模型更好的模型。
模型的性能优化是个体力活，而且随着技术的发展，以后可能不需要手动的性能优化。
模型的调优需要大量的数据和硬件。数据清洗是和 AI 没关系的纯体力活。参数调优又需要大量的硬件，¥成本普通人（公司）根本承担不起（据说 ChatGPT 训练一次的成本就高达 1 千万美元）。

一个AI公司需要多少人

前面说到AI公司需要的人少，但具体少到什么程度可能会超乎很多人的想象。

OpenAI

OpenAI（ChatGPT 的母公司），仅2022年，就花费了约5.44亿美元。而与之对应的是”今年1月，OpenAI创始人透露公司员工人数为375人“。关键是这375人里包含了行政等支持人员及数据收集整理人员。

Midjourney

相比 OpenAI ，AI绘图领域的巨头 Midjourney 在人力方面更是做到了极致。Midjourney 总共只有11人：1创始人，1财务，1法务，8研发（其中4人为本科实习生）。

参考

Midjourney：伟大的公司只需要十一人

ChatGPT和它的平替们

ChatGPT 是 OpenAI 发布的对话式大型语言模型。它可以帮你写代码，翻译，论色文章等。我现在写英文写完后要都用Bing修正一遍语法错误（发现自己写的句子几乎全有语法错误）。只是在ChatGPT价格不算便宜，且国内使用困难重重。好在还有不少 ChatGPT 的平替可以使用。不过平替总归还是平替，和 ChatGPT 比起来还是有不少差距。

平台	国外手机号，付费	需申请试用	国内直连	中文支持	备注
ChatGPT	✅		❌	✅	付费使用，功能最全，效果最好。
Bing		✅	❌	✅	由OpenAI提供技术。效果最接近 ChatGPT 的最佳平替。回答里有引用来源。不会写代码。
Bard		✅	❌	❌	谷歌出品。不会中文，效果不如 Bing 。
文心一言		✅	✅	✅	百度出品。侧重中文，智能程度一般。应当集成了 `Stable Diffusion` ，可以画画。
Poe		❌	❌	✅	Quora出品的AI 产品。提供多个AI 机器人聚合。目前可以通过Poe免费使用ChatGPT。

GitHub Copilot 平替

GitHub Copilot 可以算是编程界的 ChatGPT ，可根据上下文自动对程序进行补全。刚推出时可以免费试用，后转为订阅制。

平台	免费	备注
GitHub Copilot	❌	最早推出，效果最佳。
C odeium	✅	可用，但效果一般。据称永久免费。
CodeWhisperer	✅	亚马逊出品。注册账号需要绑定信用卡。效果和 Codeium 差不多。