当前位置:首页 > AI技术 > 正文内容

开发怎么 Gemini 批量标注图片?电商卖家提升上架效率的教程案例|Duuu笔记

admin2个月前 (04-06)AI技术65

基于真实项目经验的前端实战分享

电商卖家可通过Gemini实现商品图批量标签化:一、结构化整理图片并建CSV;二、用AI Studio逐张调用API输出JSON标签;三、Python脚本自动批量处理;四、Chrome扩展人机协同标注;五、建立类目化提示词模板库提升精度与复用性。

如果您是电商卖家,需要为大量商品图片添加标签以提升上架效率,但手动标注耗时费力,则可以借助 Gemini 的多图理解与文本生成能力实现半自动化批量标注。以下是具体操作路径:

一、准备结构化图片数据集

Gemini 本身不支持直接上传数百张图片并一键生成全部标签,需通过编程接口或分批交互方式调用其视觉理解能力。因此,第一步是将待标注图片整理为可被程序读取的结构化形式,确保命名规范、格式统一,并预留标签存储位置。

1、将所有商品图片存入同一本地文件夹,文件名不含空格与特殊符号,例如“dress_blue_001.jpg”“shirt_cotton_002.png”。

2、确认图片尺寸适中(建议长边≤2048像素),避免因超分辨率导致 Gemini API 拒绝解析或返回截断结果。

3、创建一个空的 CSV 文件,列名为“filename,category,color,material,style,description”,用于后续写入 Gemini 输出的标签字段。

二、使用 Google AI Studio 调用 Gemini Pro Vision API

通过 Google 提供的 AI Studio 平台,可调用支持图像输入的 Gemini-1.5-flash 或 Gemini-1.5-pro 模型,逐张发送图片并获取结构化文本响应。该方式无需本地部署,适合无开发经验但熟悉网页操作的卖家。

1、访问

https://aistudio.google.com/

并登录关联 Google Cloud 账号。

2、在左侧菜单选择“Get API key”,创建新密钥并复制保存;注意启用 billing 及 Gemini API 配额。

3、在 Playground 区域选择模型为

gemini

-1.5-flash

,点击“Add image”上传单张商品图,然后在提示框中输入:

“请用 JSON 格式输出以下6项:品类、主色、材质、风格、适用场景、简短卖点描述。字段名用英文小写,值用中文,不要额外解释。”

4、点击“Run”获取响应,复制 JSON 内容,粘贴至 CSV 对应行,完成单图标注。

三、用 Python 脚本批量调用 Gemini 多模态接口

对具备基础代码能力的用户,可通过 Python 调用 google.generativeai 库,循环读取文件夹内图片,自动构造请求、解析 JSON 响应并写入 CSV。此方法真正实现“批量”,单次运行可处理 50–100 张图片(受速率限制约束)。

1、安装依赖库:

pip install google-generativeai pandas

2、在脚本开头设置 API 密钥:

genai.configure(api_key="YOUR_API_KEY")

元典智库

元典智库:智能开放的法律搜索引擎

下载

3、定义 prompt 模板,固定要求输出字段与格式,例如:“你是一名资深电商运营,请针对这张商品图,严格按以下 JSON Schema 输出:{"category":"string","color":"string","material":"string","style":"string","occasion":"string","selling_point":"string"}。”

4、遍历图片路径列表,对每张图调用

model.generate_content([image, prompt])

,捕获 response.text,用 json.loads() 解析后追加到 DataFrame。

四、利用 Gemini Chrome 扩展快速人工辅助标注

对于图片数量在 20–50 张以内、且需兼顾语义准确性的中小卖家,可采用“人机协同”模式:用浏览器扩展快速唤起 Gemini 视觉分析,人工校验后一键复制标签,跳过编程环节。

1、在 Chrome 应用商店安装官方认证的

“Gemini for Google Search” 扩展

(图标为蓝白双色对话气泡)。

2、打开商品图片所在网页或本地 HTML 预览页,右键点击任意图片,选择“Ask Gemini about this image”。

3、在弹出侧边栏中输入指令:

“列出5个适合电商平台搜索的关键词,按相关性降序排列,用顿号分隔”

4、复制返回结果,粘贴至 Excel 表格对应单元格,批量填充后统一整理为标准标签字段。

五、构建本地提示词模板库提升复用性

不同类目商品需差异化提示词才能获得高精度标签。例如服饰强调版型与穿搭场景,数码配件侧重接口类型与兼容型号。建立分类提示词库可减少每次重复编辑,确保标签维度一致。

1、新建文本文档,命名为“prompt_templates.txt”,按类目分段落,如【女装】下写:“请识别图中服装的领型、袖长、裙长、季节适配性、搭配建议,忽略模特妆容与背景。”

2、【手机壳】类目下写:“提取产品图中的材质工艺(如磨砂PC、液态硅胶)、防护等级(是否包角)、功能特征(带支架/磁吸/无线充兼容)、适用机型(精确到iPhone 15 Pro Max)。”

3、实际使用时,从模板库中复制对应段落,粘贴至 Gemini 输入框,再附加当前图片,即可获得定向优化的标签输出。

相关文章

Unity 机器学习 基础

ML-Agents 资产导入 Unity 场景创建 Unity 代码部分 Anaconda 执行 rollerball_config.yaml 机器学习逻辑处理...

使用 ESP

针对该分类问题,我们使用了 Kaggle 手势识别数据集 中的一个开源数据集。原始数据集包括 10 个类别,我们只使用了其中 6 个。这些类别更容易识别,且日常生活中更有用,如...

前端开发高级应用:MuleRun如何连接Slack通知 MuleRun消息推送集成配置步骤实战案例|Duuu笔记

若MuleRun无法向Slack推送通知,需依次配置Incoming Webhook或Bot Token、在MuleRun中设置对应通知目标参数,并通过最小化任务测试验证;常见失败原因包括凭据错误、权...

前端开发实战详解:骡子快跑怎么注册账号 骡子快跑账号注册流程最佳实践|Duuu笔记

骡子快跑注册仅需1分钟,但激活码需从Discord指定频道获取,输错3次将锁账户24小时;积分与注册邮箱强绑定且不可更换;部分地区即使注册成功也无法运行Agent。 ☞☞☞AI 智能聊天, 问答助手...

bp神经网络是什么网络,神经网络和bp神经网络

1、前馈神经网络:一种最简单的神经网络,各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层.各层间没有反馈。 2、BP神经网络:是一种按照误差逆向传播...

深入理解前端开发:Minimax视频生成黑科技:复杂动作模拟完全指南|Duuu笔记

为精准模拟复杂动作,需采用分帧提示词构建、骨骼关键点引导注入和多阶段动作蒸馏三法:一、将动作拆解为带空间姿态的关键帧序列并加物理约束;二、注入2D/3D关键点坐标锚定关节位置;三、通过粗生成→特征提取...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。