<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Mali G610 &#8211; 天地一沙鸥</title>
	<atom:link href="https://haoluobo.com/tag/mali-g610/feed/" rel="self" type="application/rss+xml" />
	<link>https://haoluobo.com</link>
	<description>to be continue....</description>
	<lastBuildDate>Wed, 13 Sep 2023 07:53:46 +0000</lastBuildDate>
	<language>zh-Hans</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.8.2</generator>
	<item>
		<title>使用Docker在Orange Pi上LLM（使用GPU加速）</title>
		<link>https://haoluobo.com/2023/09/orangepi5-rk3588-mlc-llm-docker/</link>
					<comments>https://haoluobo.com/2023/09/orangepi5-rk3588-mlc-llm-docker/#comments</comments>
		
		<dc:creator><![CDATA[vicalloy]]></dc:creator>
		<pubDate>Wed, 13 Sep 2023 13:46:00 +0000</pubDate>
				<category><![CDATA[编程]]></category>
		<category><![CDATA[Mali G610]]></category>
		<category><![CDATA[MLC LLM]]></category>
		<category><![CDATA[Orange pi5]]></category>
		<category><![CDATA[RK3588S]]></category>
		<guid isPermaLink="false">https://haoluobo.com/?p=12465</guid>

					<description><![CDATA[最初买 Orange Pi 5 的目的之一就是想跑一些 AI 应用。Orange Pi 5 虽带了 NPU，但 [&#8230;]]]></description>
										<content:encoded><![CDATA[
<p>最初买 <code>Orange Pi 5</code> 的目的之一就是想跑一些 AI 应用。<code>Orange Pi 5</code> 虽带了 NPU，但这颗 NPU 实在太小众，除了官方的 Demo 就没法轻松把 NPU 用起来。近期看到有人用 <code>RK3588</code> 跑LLM，于是把吃灰已久的 <code>Orange Pi 5</code> 拿出来折腾。</p>



<p><code>Orange Pi 5</code> 使用的是 <code>RK3588</code> 芯片，该芯片配备的 GPU 是 <code>Mali-G610</code>。在 <code>Orange Pi 5</code> 上跑 LLM 用的就是这颗 GPU 。</p>



<h2 class="wp-block-heading">基本用法</h2>



<p>LLM 模型通过 <a href="https://github.com/mlc-ai/mlc-llm" target="_blank" rel="noreferrer noopener">MLC LLM</a> 项目加载运行。在 <code>Orange Pi 5</code> 上通过 OpenCL 实现 GPU 加速，因此要求系统支持 OpenCL 。<code>Orange Pi 5</code> 的官方 Linux 镜像已添加了 OpenCL 支持，因此不用再额外安装驱动。</p>



<p>如果 <code>Orange Pi 5</code> 上已经安装了 Docker 可以使用下面的命令把服务跑起来。7b-f16 的模型会用到 6.xG 的内存，如果你的系统只有4G内存可以试试 3b-f16 的模型。</p>



<pre class="wp-block-code"><code># 更多镜像见 https://hub.docker.com/r/vicalloy/mlc-llm-rk3588/tags
docker run --rm -it --privileged \
    vicalloy/mlc-llm-rk3588:FlagAlpha-Llama2-Chinese-7b-Chat-q4f16_1</code></pre>



<h2 class="wp-block-heading">编译自己的Docker镜像</h2>



<p><a href="https://github.com/milas/rock5-toolchain/" target="_blank" rel="noreferrer noopener">rock5-toolchain</a> 项目中提供了 <code>MLC LLM</code> 的 <a href="https://github.com/milas/rock5-toolchain/blob/main/extra/mlc-llm/Dockerfile" target="_blank" rel="noreferrer noopener">Dockerfile</a> ，可以通过修改 Dockerfile 里的 <code>ARG MODEL</code> 来打包不同的模型。</p>



<p>为了更方便的打包不同的模型，更为了白嫖 <code>Github Actions</code> 服务器，我参考 <a href="https://github.com/milas/rock5-toolchain/" target="_blank" rel="noreferrer noopener">rock5-toolchain</a> 项目写了自己的 Dockerfile。相比原始的 Dockerfile，我把TVM编译/G610驱动安装等步骤打包在镜像 <code>vicalloy/mlc-llm-rk3588:base</code> 预置 model 的镜像从该镜像继承。要预置不同的模型，只要将对应的模型复制到镜像就好。</p>



<p>对应项目地址：<a href="https://github.com/vicalloy/docker-images/tree/main/mlc-llm-rk3588" target="_blank" rel="noreferrer noopener">https://github.com/vicalloy/docker-images/tree/main/mlc-llm-rk3588</a></p>



<h2 class="wp-block-heading">参考链接：</h2>



<ul class="wp-block-list">
<li><a href="https://milas.dev/blog/mali-g610-rk3588-mlc-llm-docker/" target="_blank" rel="noreferrer noopener">GPU-Accelerated LLM on ARM64…in Docker</a></li>



<li><a href="https://blog.mlc.ai/2023/08/09/GPU-Accelerated-LLM-on-Orange-Pi" target="_blank" rel="noreferrer noopener">GPU-Accelerated LLM on a $100 Orange Pi</a></li>



<li><a href="https://zhuanlan.zhihu.com/p/650110025" target="_blank" rel="noreferrer noopener">利用GPU加速，在Orange Pi上跑LLMs</a></li>
</ul>
]]></content:encoded>
					
					<wfw:commentRss>https://haoluobo.com/2023/09/orangepi5-rk3588-mlc-llm-docker/feed/</wfw:commentRss>
			<slash:comments>3</slash:comments>
		
		
			</item>
	</channel>
</rss>
