当前位置:首页手机软件娱乐软件 → MNN Chat官方下载2025安卓版 v0.7.1

MNN Chat官方下载2025安卓版

发表评论
  • 软件类别:娱乐软件
  • 软件大小:34.5M
  • 更新时间:2025-09-02 20:58
  • 软件版本:v0.7.1
  • 软件语言:中文
  • 软件等级:
  • 软件厂商:
  • 官方网址:https://www.mnn.zone/m/0.3/index.html
  • 备案号:
  • 相关标签: ai
评分
好评:1 差评:1
应用介绍

MNN Chat 2025安卓版(com.alibaba.mnnllm.android),高效部署大语言模型!支持千问、百川、LLAMA等多种模型,兼容Tensorflow、ONNX等格式。亮点在于多模态大模型支持,新增LLM单步执行、扩展采样算法等功能,CPU/GPU性能大幅优化,加载速度更快。适用于手机、PC等设备,快来体验流畅的AI对话!

MNN Chat是什么

MNN-LLM是基于MNN引擎开发的大语言模型运行方案,解决大语言模型在本地设备的高效部署问题(手机/个人电脑/嵌入式设备)。支持常见的千问/百川/智谱/LLAMA等大语言模型。

MNN Chat怎么用

1、在本站下载安装软件,打开后进入主页,进入主页可以看到AI模型,大家可以根据自己的需求选择想要部署的AI模型;

MNN Chat

2、然后选择需要下载的文件,直接点击就能快速下载;

MNN Chat

3、还可以在搜索框输入关键词进行搜索下载。

MNN Chat

支持哪些

支持 Tensorflow、Caffe、ONNX、Torchscripts 等主流模型文件格式,支持CNN / RNN / GAN / Transformer 等主流网络结构。

支持多输入多输出,支持任意维度的输入输出,支持动态输入(输入大小可变),支持带控制流的模型

算子丰富,支持 178 个Tensorflow Op、52个 Caffe Op、163个 Torchscipts Op、158 个 ONNX Op(ONNX 基本完整支持)

支持 服务器 / 个人电脑 / 手机 及具有POSIX接口的嵌入式设备,支持使用设备的 CPU / GPU 计算,支持部分设备的 NPU 计算(IOS 11 + CoreML / Huawei + HIAI / Android + NNAPI)

支持 Windows / iOS 8.0+ / Android 4.3+ / Linux  及具有POSIX接口的操作系统

使用说明

1、兼容 Tensorflow、Caffe、ONNX、Torchscripts 等多种主流模型文件格式,并适配 CNN、RNN、GAN、Transformer 等主流网络架构。

2、具备多输入多输出能力,可处理任意维度的输入输出数据,支持动态输入(即输入大小不固定),同时兼容含有控制流的模型。

3、算子库丰富,涵盖 178 个 Tensorflow 操作符、52 个 Caffe 操作符、163 个 Torchscripts 操作符、158 个 ONNX 操作符(ONNX 操作符基本实现全面支持)。

4、广泛适用于服务器、个人电脑、手机以及具有POSIX接口的嵌入式设备,支持利用这些设备的 CPU、GPU 进行计算,同时部分设备还支持 NPU 计算(如 IOS 11 及以上版本的 CoreML、华为 HIAI、Android NNAPI)。

5、操作系统兼容性强,支持 Windows、iOS 8.0 及以上版本、Android 4.3 及以上版本、Linux 以及具有POSIX接口的其他操作系统。

MNN Chat最新版本更新内容

LLM 相关更新

App 发布

Android

新增Android的大模型应用(LLM / Diffusion),详见 apps/Android/MnnLlmChat/README.md

iOS

新增 iOS 的大模型应用,详见 apps/iOS/MNNLLMChat/README.md

新特性

模型支持

支持 Qwen2-VL / Qwen2-Audio / Qwen2.5-VL 等多模态大模型的导出和运行。

支持 DeepSeek-R1-1.5B-Qwen 和 DeepSeek-R1-7B-Qwen

LLM 单步执行支持

新增了对 LLM 单步执行的支持,便于调试和优化模型推理过程。

LLM 扩展采样算法支持

扩展了采样算法的支持,提升了模型推理的灵活性和多样性。

LLM 导出模型时支持输出历史 Token 的概率值

在导出 LLM 模型时,新增了输出历史 Token 概率值的功能,便于后续分析和优化。

LLM-CPU 支持 mmap 文件缓存

新增了对 mmap 文件缓存的支持,使二次加载模型时避免内存重排,提升了加载效率。

性能优化

CPU 多线程性能进一步提升

对 LLM 多线程性能进行了优化,进一步提升了整体推理速度。

CPU prefill 性能优化

优化了 CPU 上 prefill 性能,使 1024 token 输入和 512 token 输入的 prefill 性能持平。

GPU 优化 OpenCL AutoTuning 耗时

优化了 OpenCL AutoTuning 的耗时,避免了首次推理耗时过长的问题。

GPU 优化:Metal / OpenCL 支持 fp16 的 scale/bias,支持对称量化优化

Metal / OpenCL 后端支持 fp16 的 scale/bias 和对称量化优化的支持,提升了推理效率。

LLM 加速:Metal / OpenCL 后端支持 scale/bias 使用 fp16

Metal / OpenCL 支持 scale/bias 使用 fp16(设置 precision = low 时启用),进一步优化了 GPU 推理性能。

应用信息
  • 包名:com.alibaba.mnnllm.android.release
  • 名称:MNN Chat
  • 版本:0.7.1.gp
  • MD5值:6d802224e3d2d799515ce470b91436e2
热门专题

优惠多的购物返利软件大全ai视频生成工具

ai视频生成工具是为大家带来的ai视频生成工具大全。这里汇聚了各种好用的ai视频生成app,帮助用户轻松的生成ai视频。可将文本或图像转换为高质量视频,支持多种风格和效果,提供免费版本,能满足不同创作需求。ai视频生成怎么赚钱的一、个性化推荐与广告变现1.数据分析与用户画像AI技术能够通过大数据分析,精准描绘用户画像,实现视频内容的个性化推荐。这不仅提升了用户体验,也为广告商提供了高效的广告投放途径。2.广告定向投放

优惠多的购物返利软件大全ai文案创作

ai文案创作无需自己费尽心思构思文字,只需在这里找到适合自己需求的软件,即可轻松创作出优秀的文案作品。无论你是创作者、市场人员还是广告从业者,AI文案创作软件大全聚合页面都是你不可错过的利器。

网友评论
昵称:
表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲
字数: 0/500 请自觉遵守互联网相关政策法规,评论内容只代表网友观点,与本站立场无关!

热门评论

最新评论

第 4 楼 广东广州电信 网友 客人 2025/9/2 9:46:18
MNNChat2025的更新速度和功能迭代令人称赞。最新版本对多模态大模型的支持,以及LLM扩展采样算法的加入,都展现了团队的创新力。特别是CPU prefill性能和OpenCL AutoTuning的优化,让我在体验AI对话时感受到了前所未有的流畅和稳定。期待未来的更多突破!

支持( 0 ) 盖楼(回复)

第 3 楼 山东青岛联通 网友 客人 2025/9/2 8:45:55
这款应用最让我惊喜的是它极强的兼容性。我的旧安卓平板和新PC都能流畅运行,甚至连家里的嵌入式设备也能部署。MNN引擎的优化让各种设备都能发挥出最大潜力,无论是CPU、GPU,还是部分NPU,都能有效利用。真正做到了让高性能AI触手可及,普惠大众。

支持( 0 ) 盖楼(回复)

第 2 楼 宁夏银川中移铁通 网友 客人 2025/9/2 5:47:23
作为一名开发者,我对MNNChat2025的技术实力深感佩服。它不仅支持Tensorflow、ONNX等多种模型格式,最新的多模态大模型如Qwen2-VL和LLM单步执行功能更是锦上添花。动态输入和丰富的算子库让模型部署变得前所未有的灵活,是一款真正为AI落地而生的利器!

支持( 0 ) 盖楼(回复)

第 1 楼 山东青岛联通 网友 客人 2025/9/2 3:42:29
MNNChat2025安卓版简直是移动AI应用领域的里程碑!它让大语言模型在我的手机上跑得飞快,无论是千问还是LLAMA,响应都非常流畅。最新的性能优化,特别是CPU多线程和GPU的改进,让加载速度和推理效率都达到了一个新的高度,现在能随时随地体验高质量的AI对话了,完全超出预期。

支持( 0 ) 盖楼(回复)

广告联系|版权声明|下载帮助|软件发布

Copyright © 2016-2025 www.y8l.com All Rights Reserved    举报邮箱:y8lzyw@sina.com 商务合作:liurui021110@gmail.com

网站备案许可证号:鄂ICP备2020019878号-5