AI | ByteJog

用免费的 Gemini 2.5 Pro 实现 Deep Research

推荐一个开源项目u14app/deep-research，基于Google的Gemini模型实现Deep Research，最近Gemini 2.5 Pro很能打，一推出来就上榜首了。 ### 功能快速深度研究：约 2 分钟即可生成综合研究报告，显著加快您的研究进程。多平台支持：支持快速部署到 Vercel、Cloudflare 和其他平台。由 Google Gemini 提供支持：利用先进的 Google Gemini 模型进行准确而有见地的分析。思维与网络模型：采用先进的“思维”和“网络”模型，兼顾深度与速度，快速获得高质量结果。支持切换研究模型。 Canvas 支持研究内容的编辑，提供所见即所得和 Markdown 两种编辑模式，可调整阅读级别、文章长度以及全文翻译。研究历史：支持保存研究历史，可以随时回顾以前的研究成果并再次进行深入研究。本地和服务器 API 支持：提供灵活的本地和服务器端 API 调用选项，以满足您的需求。注重隐私：您的数据保持私密和安全，因为所有数据都本地存储在您的浏览器中。多语言支持：英语、简体中文。采用现代技术构建：使用 Next.js 15 和 Shadcn UI 开发，确保现代、高性能且视觉上吸引人的用户体验。 MIT 许可：开源且可根据 MIT 许可免费供个人和商业使用。此项目需要使用 Gemini API key，您可以在 Google AI Studio 上免费申请。如果需要 API 代理地址，可以参考之前的帖子如何优雅流畅的使用Google Gemini 1.5 pro服务，也可以找到一些公益的 Gemini API 代理，或者使用 Cloudflare AI Gateway 项目支持的部署方式：一键部署项目，可以选择部署到 Vercel 或者 Cloudflare docker部署静态部署非常值得推荐在最新的 Gemini 2.5 Pro 的加持下，研究结果大幅提升，如果说之前是大学生水平，那么在 Gemini 2.5 Pro 的加持下，甚至可以达到博士生的论文水平。 ...

如何体验 Chrome 内置 Gemini Nano 大模型？

最近谷歌在Canary 版本的 Chrome 浏览器里面开放了本地大模型的权限，用户可以访问（https://www.chromium.org/getting-involved/dev-channel/），下载 Canary 浏览器。用法如下：打开 chrome://flags/ 将 Prompt API for Gemini Nano 设置为 Enable 将 Enables optimization guide on device 设置为 Enable BypassPerfR 重启 Chrome 浏览器打开 chrome://components/ 检查是否出现 Optimization Guide On Device Model ，我出现这个选项等了有几天，没有找到好的方法。如果有这个选项，可以检查模型是否成功下载，点击 Check for update ，我目前的版本是Version: 2024.6.5.2205 。 Gemini Nano的模型文件存放在~/Library/Application Support/Google/Chrome Canary/OptGuideOnDeviceModel/2024.6.5.2205 目录下，weights.bin 文件大概1.78GB。测试AI效果打开控制台，输入 window.ai 测试是否能有返回AI对象，也可以用下面的代码测试： const canCreate = await window.ai.canCreateGenericSession() if (canCreate !== "no") { const session = await window.ai.createTextSession(); const stream = session.promptStreaming("写一个短篇科幻小说！") for await (const chunk of stream) { console.log(chunk) } session.destroy() } else { console.error("Gemini Nano not ready yet.", canCreate) } 刚刚返回的结果： ...

[译]50天学习人工智能/机器学习：从入门到精通（适用于非计算机科学背景人员）

简介该网页为非计算机专业背景的人提供了一个学习人工智能/机器学习的 50 天路线图，强调解决问题的思维方式、学习和认证比技术背景或学位更重要。摘要题为 “50 天学习人工智能/机器学习：从零到英雄（非计算机专业背景）“的内容旨在帮助对人工智能/机器学习感兴趣的非计算机专业背景的个人，提供一个学习必要技能的 50 天路线图。该路线图假定读者对高中数学、线性代数、矩阵以及一些统计学和概率论有基本的了解。它包括 Python、Numpy、Pandas、Matplotlib、TensorFlow 和其他工具的学习资源，以及完成 Andrew Ng 的机器学习专业课程。路线图强调，要想在人工智能/机器学习领域取得成功，只需具备解决问题的思维方式、学习意愿和一些证书。建议作者认为，非计算机专业背景的人也可以通过正确的心态和资源学习人工智能/机器学习。作者强调了解决问题的心态和学习意愿的重要性，而不是技术背景或学位。作者建议，对高中数学、线性代数、矩阵以及一些统计学和概率论有基本了解，就足以开始学习人工智能/机器学习。作者建议完成 Andrew Ng 的机器学习专业课程，作为 50 天路线图的一部分。作为路线图的一部分，作者提供了学习 Python、Numpy、Pandas、Matplotlib、TensorFlow 和其他工具的资源。作者鼓励个人练习编码和完成实践练习，以巩固所学知识。作者承认，学习人工智能/机器学习有时会让人感到沮丧，并建议在必要时休息一下。对人工智能感兴趣？非计算机专业背景？看起来像珠穆朗玛峰？不知道从哪里开始？或者要怎样才能达到目标？我能感受到你的心情。如果你想知道你能不能做到，以及如何做到，请稍等片刻。你不会后悔的那么，让我们进入正题。学习的基础需要什么？你只需要一点这方面的能力、解决问题的心态、学习的意愿和一些证书。请放心，你绝对不需要任何技术背景，也不需要计算机/人工智能学位。这个备忘录可能会让你轻松一些。你只需输入 import keras，keras 就会为你完成所有复杂的工作。你只需知道发生了什么。 Credits: https://m.facebook.com/groups/1638417209555402/ 这是我 50 天内学习机器学习的“试错”之旅，经过提炼整理，更加有条理。假设你在高中时认真上过数学课，对线性代数、矩阵、统计学和概率论略知一二，那么我们就可以进入第 1 天，马上开始真正的学习。第1天机器学习专项课程，作者：Andrew Ng Deeplearning.ai YouTube 频道和 Coursera 提供 5 小时的课程。第 2-3 天 Python：基本了解和练习。了解从 PRINT 到 FUNCTIONS 和 CLASSES 的所有内容。 ...

如何优雅流畅的使用ChatGPT gpt-4o服务

获取OpenAI API KEY 由于OpenAI官网的是不支持中国大陆的信用卡支付，这个步骤是比较复杂的。目前是通过注册OCBC的借记卡实现支付，正常使用一个月了。OCBC银行卡办理网上有不少教程，不过关于推荐码不是一定要填，你不填也是可以注册成功，填了推荐码入金1000SGD之后推荐的人有奖励，个人返现不受推荐码限制。注册过程到拿到实体卡，到完全激活响应2周时间，入金通过工行转账2个小时就到账了。之后就可以付费了，选择美国免税区不用缴税。（题外话，原来办理OCBC是想着注册甲骨文云，实践下来不行）另外还有一种简单方式，用中转服务，有一些汇率的手续费。地址：https://api.oaipro.com/ 充值就可以用，用这个中转，不需要配置nginx，直接跳到one api配置。代理OpenAI请求 Nginx代理通过Nginx是把代理放到个人小机上面，这样要求你的小鸡能够正常访问OpenAI。这种形式的好处就是以固定IP的形式访问服务。在服务器运行测试命令，替换 OPENAI_API_KEY 为你的API key，有回复可以进行下一步 curl https://api.openai.com/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer $OPENAI_API_KEY" \ -d '{ "model": "gpt-3.5-turbo-0125", "response_format": { "type": "json_object" }, "messages": [ { "role": "system", "content": "You are a helpful assistant designed to output JSON." }, { "role": "user", "content": "Who won the world series in 2020?" } ] }' Nginx配置server部分如下： ...

如何优雅流畅的使用Google Gemini 1.5 pro服务

获取Gemini API KEY 准备3-4个谷歌账号，因为5月2日之后谷歌就开始收费，Gemini 1.5免费1分钟2次请求，一天50次，多个账号均衡一下请求，满足日常使用。可以按照大佬分享方法注册账号无需手机号认证注册谷歌邮箱进入谷歌获取Get API key 现在不用申请直接可以使用的1.5模型代理谷歌请求 Cloudflare 代理可以参考zhile的我们也要用Gemini Pro Nginx代理原理和上面一致，通过Nginx是把代理放到个人小机上面，这样要求你的小鸡能够正常访问谷歌。这种形式的好处就是以固定IP的形式访问谷歌大模型服务。在服务器运行测试命令，替换 YOUR_API_KEY 为你的API key，有回复可以进行下一步 curl \ -H 'Content-Type: application/json' \ -d '{"contents":[{"parts":[{"text":"Write a story about a magic backpack"}]}]}' \ -X POST 'https://generativelanguage.googleapis.com/v1beta/models/gemini-pro:generateContent?key=YOUR_API_KEY' Nginx配置server部分如下： server { listen 443 ssl; server_name _; root /xxx/html/web; # ssl on; ssl_certificate /xxx/xxx/ca.pem; ssl_certificate_key /xxx/xxx/private.key; allow 103.21.244.0/22; allow 103.22.200.0/22; allow 103.31.4.0/22; allow 141.101.64.0/18; allow 108.162.192.0/18; allow 190.93.240.0/20; allow 188.114.96.0/20; allow 197.234.240.0/22; allow 198.41.128.0/17; allow 162.158.0.0/15; allow 104.16.0.0/13; allow 104.24.0.0/14; allow 172.64.0.0/13; allow 131.0.72.0/22; deny all; location ^~ /Safari1261/ { # Google Gemini API 服务代理 proxy_ssl_server_name on; #proxy_pass https://api.openai.com; proxy_pass https://generativelanguage.googleapis.com/; proxy_buffering off; client_max_body_size 300m; } } 配置说明 ...

低成本AI音色克隆软件【GPT-SoVITS】使用教程

GPT-SoVITS ：https://github.com/RVC-Boss/GPT-SoVITS 官方demo介绍：https://www.bilibili.com/video/BV12g4y1m7Uw 功能：零样本文本到语音（TTS）：输入 5 秒的声音样本，即刻体验文本到语音转换。少样本 TTS：仅需 1 分钟的训练数据即可微调模型，提升声音相似度和真实感。跨语言支持：支持与训练数据集不同语言的推理，目前支持英语、日语和中文。 WebUI 工具：集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注，协助初学者创建训练数据集和 GPT/SoVITS 模型。使用过程简介：数据处理 UVR5 人声处理音频切割音频降噪音频打标校对标注训练数据集格式化微调训练推理教程实验环境：Ubuntu 22.04，NVIDIA RTX A6000 采用docker形式部署 docker-compose.yaml文件：https://raw.githubusercontent.com/RVC-Boss/GPT-SoVITS/main/docker-compose.yaml 0. 准备工作在主目录下创建GPT-SoVITS，并下载docker-compose.yaml，包括模型的镜像大小5G左右 cd ~ mkdir GPT-SoVITS cd GPT-SoVITS mkdir logs output reference SoVITS_weights GPT_weights curl -o docker-compose.yaml https://raw.githubusercontent.com/RVC-Boss/GPT-SoVITS/main/docker-compose.yaml 默认docker-compose.yaml需要做一下调整，需要将 GPT_weights文件夹映射出来。原始内容： volumes: - ./output:/workspace/output - ./logs:/workspace/logs - ./SoVITS_weights:/workspace/SoVITS_weights - ./reference:/workspace/reference 修改后的内容（增加GPT_weights一行映射）： ...