如何体验 Chrome 内置 Gemini Nano 大模型?

最近谷歌在Canary 版本的 Chrome 浏览器里面开放了本地大模型的权限,用户可以访问(https://www.chromium.org/getting-involved/dev-channel/),下载 Canary 浏览器。 用法如下: 打开 chrome://flags/ 将 Prompt API for Gemini Nano 设置为 Enable 将 Enables optimization guide on device 设置为 Enable BypassPerfR 重启 Chrome 浏览器 打开 chrome://components/ 检查是否出现 Optimization Guide On Device Model ,我出现这个选项等了有几天,没有找到好的方法。如果有这个选项,可以检查模型是否成功下载,点击 Check for update ,我目前的版本是Version: 2024.6.5.2205 。 Gemini Nano的模型文件存放在~/Library/Application Support/Google/Chrome Canary/OptGuideOnDeviceModel/2024.6.5.2205 目录下,weights.bin 文件大概1.78GB。 测试AI效果 打开控制台,输入 window.ai 测试是否能有返回AI对象,也可以用下面的代码测试: const canCreate = await window.ai.canCreateGenericSession() if (canCreate !== "no") { const session = await window.ai.createTextSession(); const stream = session.promptStreaming("写一个短篇科幻小说!") for await (const chunk of stream) { console.log(chunk) } session.destroy() } else { console.error("Gemini Nano not ready yet.", canCreate) } 刚刚返回的结果: ...

六月 23, 2024 · 1 分钟 · 113 字 · Byter ·  AI

[译]50天学习人工智能/机器学习:从入门到精通(适用于非计算机科学背景人员)

简介 该网页为非计算机专业背景的人提供了一个学习人工智能/机器学习的 50 天路线图,强调解决问题的思维方式、学习和认证比技术背景或学位更重要。 摘要 题为 “50 天学习人工智能/机器学习 :从零到英雄(非计算机专业背景)“的内容旨在帮助对人工智能/机器学习感兴趣的非计算机专业背景的个人,提供一个学习必要技能的 50 天路线图。该路线图假定读者对高中数学、线性代数、矩阵以及一些统计学和概率论有基本的了解。它包括 Python、Numpy、Pandas、Matplotlib、TensorFlow 和其他工具的学习资源,以及完成 Andrew Ng 的机器学习专业课程。路线图强调,要想在人工智能/机器学习领域取得成功,只需具备解决问题的思维方式、学习意愿和一些证书。 建议 作者认为,非计算机专业背景的人也可以通过正确的心态和资源学习人工智能/机器学习。 作者强调了解决问题的心态和学习意愿的重要性,而不是技术背景或学位。 作者建议,对高中数学、线性代数、矩阵以及一些统计学和概率论有基本了解,就足以开始学习人工智能/机器学习。 作者建议完成 Andrew Ng 的机器学习专业课程,作为 50 天路线图的一部分。 作为路线图的一部分,作者提供了学习 Python、Numpy、Pandas、Matplotlib、TensorFlow 和其他工具的资源。 作者鼓励个人练习编码和完成实践练习,以巩固所学知识。 作者承认,学习人工智能/机器学习 有时会让人感到沮丧,并建议在必要时休息一下。 对人工智能感兴趣?非计算机专业背景?看起来像珠穆朗玛峰?不知道从哪里开始?或者要怎样才能达到目标?我能感受到你的心情。 如果你想知道你能不能做到,以及如何做到,请稍等片刻。你不会后悔的那么,让我们进入正题。 学习的基础需要什么? 你只需要一点这方面的能力、解决问题的心态、学习的意愿和一些证书。请放心,你绝对不需要任何技术背景,也不需要 计算机/人工智能 学位。 这个备忘录可能会让你轻松一些。你只需输入 import keras,keras 就会为你完成所有复杂的工作。你只需知道发生了什么。 Credits: https://m.facebook.com/groups/1638417209555402/ 这是我 50 天内学习机器学习的“试错”之旅,经过提炼整理,更加有条理。 假设你在高中时认真上过数学课,对线性代数、矩阵、统计学和概率论略知一二,那么我们就可以进入第 1 天,马上开始真正的学习。 第1天 机器学习专项课程,作者:Andrew Ng Deeplearning.ai YouTube 频道和 Coursera 提供 5 小时的课程。 第 2-3 天 Python:基本了解和练习。了解从 PRINT 到 FUNCTIONS 和 CLASSES 的所有内容。 ...

六月 5, 2024 · 2 分钟 · 254 字 · Byter ·  AI

如何优雅流畅的使用ChatGPT gpt-4o服务

获取OpenAI API KEY 由于OpenAI官网的是不支持中国大陆的信用卡支付,这个步骤是比较复杂的。 目前是通过注册OCBC的借记卡实现支付,正常使用一个月了。OCBC银行卡办理网上有不少教程,不过关于推荐码不是一定要填,你不填也是可以注册成功,填了推荐码入金1000SGD之后推荐的人有奖励,个人返现不受推荐码限制。注册过程到拿到实体卡,到完全激活响应2周时间,入金通过工行转账2个小时就到账了。之后就可以付费了,选择美国免税区不用缴税。(题外话,原来办理OCBC是想着注册甲骨文云,实践下来不行) 另外还有一种简单方式 ,用中转服务,有一些汇率的手续费。 地址:https://api.oaipro.com/ 充值就可以用,用这个中转,不需要配置nginx,直接跳到one api配置。 代理OpenAI请求 Nginx代理 通过Nginx是把代理放到个人小机上面,这样要求你的小鸡能够正常访问OpenAI。 这种形式的好处就是以固定IP的形式访问服务。 在服务器运行测试命令,替换 OPENAI_API_KEY 为你的API key,有回复可以进行下一步 curl https://api.openai.com/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -d '{ "model": "gpt-3.5-turbo-0125", "response_format": { "type": "json_object" }, "messages": [ { "role": "system", "content": "You are a helpful assistant designed to output JSON." }, { "role": "user", "content": "Who won the world series in 2020?" } ] }' Nginx配置server部分如下: ...

五月 18, 2024 · 3 分钟 · 579 字 · Byter ·  AI ·  OpenAI

如何优雅流畅的使用Google Gemini 1.5 pro服务

获取Gemini API KEY 准备3-4个谷歌账号,因为5月2日之后谷歌就开始收费,Gemini 1.5免费1分钟2次请求,一天50次,多个账号均衡一下请求,满足日常使用。 可以按照大佬分享方法注册账号 无需手机号认证注册谷歌邮箱 进入谷歌获取Get API key 现在不用申请直接可以使用的1.5模型 代理谷歌请求 Cloudflare 代理 可以参考zhile的 我们也要用Gemini Pro Nginx代理 原理和上面一致,通过Nginx是把代理放到个人小机上面,这样要求你的小鸡能够正常访问谷歌。 这种形式的好处就是以固定IP的形式访问谷歌大模型服务。 在服务器运行测试命令,替换 YOUR_API_KEY 为你的API key,有回复可以进行下一步 curl \ -H 'Content-Type: application/json' \ -d '{"contents":[{"parts":[{"text":"Write a story about a magic backpack"}]}]}' \ -X POST 'https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key=YOUR_API_KEY' Nginx配置server部分如下: server { listen 443 ssl; server_name _; root /xxx/html/web; # ssl on; ssl_certificate /xxx/xxx/ca.pem; ssl_certificate_key /xxx/xxx/private.key; allow 103.21.244.0/22; allow 103.22.200.0/22; allow 103.31.4.0/22; allow 141.101.64.0/18; allow 108.162.192.0/18; allow 190.93.240.0/20; allow 188.114.96.0/20; allow 197.234.240.0/22; allow 198.41.128.0/17; allow 162.158.0.0/15; allow 104.16.0.0/13; allow 104.24.0.0/14; allow 172.64.0.0/13; allow 131.0.72.0/22; deny all; location ^~ /Safari1261/ { # Google Gemini API 服务代理 proxy_ssl_server_name on; #proxy_pass https://api.openai.com; proxy_pass https://generativelanguage.googleapis.com/; proxy_buffering off; client_max_body_size 300m; } } 配置说明 ...

四月 14, 2024 · 4 分钟 · 684 字 · Byter ·  AI ·  Gemini

低成本AI音色克隆软件【GPT-SoVITS】使用教程

GPT-SoVITS :https://github.com/RVC-Boss/GPT-SoVITS 官方demo介绍:https://www.bilibili.com/video/BV12g4y1m7Uw 功能: 零样本文本到语音(TTS): 输入 5 秒的声音样本,即刻体验文本到语音转换。 少样本 TTS: 仅需 1 分钟的训练数据即可微调模型,提升声音相似度和真实感。 跨语言支持: 支持与训练数据集不同语言的推理,目前支持英语、日语和中文。 WebUI 工具: 集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。 使用过程简介: 数据处理 UVR5 人声处理 音频切割 音频降噪 音频打标 校对标注 训练 数据集格式化 微调训练 推理 教程 实验环境:Ubuntu 22.04,NVIDIA RTX A6000 采用docker形式部署 docker-compose.yaml文件:https://raw.githubusercontent.com/RVC-Boss/GPT-SoVITS/main/docker-compose.yaml 0. 准备工作 在主目录下创建GPT-SoVITS,并下载docker-compose.yaml,包括模型的镜像大小5G左右 cd ~ mkdir GPT-SoVITS cd GPT-SoVITS mkdir logs output reference SoVITS_weights GPT_weights curl -o docker-compose.yaml https://raw.githubusercontent.com/RVC-Boss/GPT-SoVITS/main/docker-compose.yaml 默认docker-compose.yaml需要做一下调整,需要将 GPT_weights文件夹映射出来。 原始内容: volumes: - ./output:/workspace/output - ./logs:/workspace/logs - ./SoVITS_weights:/workspace/SoVITS_weights - ./reference:/workspace/reference 修改后的内容(增加GPT_weights一行映射): ...

三月 16, 2024 · 2 分钟 · 226 字 · Byter ·  AI ·  TTS