当前位置:首页 > AI技术 > 正文内容

前端开发高级应用:怎么用 Gemini 批量标注图片?电商卖家提升上架效率的教程实战案例|Duuu笔记

admin2个月前 (03-27)AI技术67

电商卖家可通过Gemini实现商品图批量标签化:一、结构化整理图片并建CSV;二、用AI Studio逐张调用API输出JSON标签;三、Python脚本自动批量处理;四、Chrome扩展人机协同标注;五、建立类目化提示词模板库提升精度与复用性。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您是电商卖家,需要为大量商品图片添加标签以提升上架效率,但手动标注耗时费力,则可以借助 Gemini 的多图理解与文本生成能力实现半自动化批量标注。以下是具体操作路径:

一、准备结构化图片数据集

Gemini 本身不支持直接上传数百张图片并一键生成全部标签,需通过编程接口或分批交互方式调用其视觉理解能力。因此,第一步是将待标注图片整理为可被程序读取的结构化形式,确保命名规范、格式统一,并预留标签存储位置。

1、将所有商品图片存入同一本地文件夹,文件名不含空格与特殊符号,例如“dress_blue_001.jpg”“shirt_cotton_002.png”。

2、确认图片尺寸适中(建议长边≤2048像素),避免因超分辨率导致 Gemini API 拒绝解析或返回截断结果。

3、创建一个空的 CSV 文件,列名为“filename,category,color,material,style,description”,用于后续写入 Gemini 输出的标签字段。

二、使用 Google AI Studio 调用 Gemini Pro Vision API

通过 Google 提供的 AI Studio 平台,可调用支持图像输入的 Gemini-1.5-flash 或 Gemini-1.5-pro 模型,逐张发送图片并获取结构化文本响应。该方式无需本地部署,适合无开发经验但熟悉网页操作的卖家。

1、访问

https://aistudio.google.com/

并登录关联 Google Cloud 账号。

2、在左侧菜单选择“Get API key”,创建新密钥并复制保存;注意启用 billing 及 Gemini API 配额。

3、在 Playground 区域选择模型为

gemini

-1.5-flash

,点击“Add image”上传单张商品图,然后在提示框中输入:

“请用 JSON 格式输出以下6项:品类、主色、材质、风格、适用场景、简短卖点描述。字段名用英文小写,值用中文,不要额外解释。”

4、点击“Run”获取响应,复制 JSON 内容,粘贴至 CSV 对应行,完成单图标注。

三、用 Python 脚本批量调用 Gemini 多模态接口

对具备基础代码能力的用户,可通过 Python 调用 google.generativeai 库,循环读取文件夹内图片,自动构造请求、解析 JSON 响应并写入 CSV。此方法真正实现“批量”,单次运行可处理 50–100 张图片(受速率限制约束)。

1、安装依赖库:

pip install google-generativeai pandas

2、在脚本开头设置 API 密钥:

genai.configure(api_key="YOUR_API_KEY")

元典智库

元典智库:智能开放的法律搜索引擎

下载

3、定义 prompt 模板,固定要求输出字段与格式,例如:“你是一名资深电商运营,请针对这张商品图,严格按以下 JSON Schema 输出:{"category":"string","color":"string","material":"string","style":"string","occasion":"string","selling_point":"string"}。”

4、遍历图片路径列表,对每张图调用

model.generate_content([image, prompt])

,捕获 response.text,用 json.loads() 解析后追加到 DataFrame。

四、利用 Gemini Chrome 扩展快速人工辅助标注

对于图片数量在 20–50 张以内、且需兼顾语义准确性的中小卖家,可采用“人机协同”模式:用浏览器扩展快速唤起 Gemini 视觉分析,人工校验后一键复制标签,跳过编程环节。

1、在 Chrome 应用商店安装官方认证的

“Gemini for Google Search” 扩展

(图标为蓝白双色对话气泡)。

2、打开商品图片所在网页或本地 HTML 预览页,右键点击任意图片,选择“Ask Gemini about this image”。

3、在弹出侧边栏中输入指令:

“列出5个适合电商平台搜索的关键词,按相关性降序排列,用顿号分隔”

4、复制返回结果,粘贴至 Excel 表格对应单元格,批量填充后统一整理为标准标签字段。

五、构建本地提示词模板库提升复用性

不同类目商品需差异化提示词才能获得高精度标签。例如服饰强调版型与穿搭场景,数码配件侧重接口类型与兼容型号。建立分类提示词库可减少每次重复编辑,确保标签维度一致。

1、新建文本文档,命名为“prompt_templates.txt”,按类目分段落,如【女装】下写:“请识别图中服装的领型、袖长、裙长、季节适配性、搭配建议,忽略模特妆容与背景。”

2、【手机壳】类目下写:“提取产品图中的材质工艺(如磨砂PC、液态硅胶)、防护等级(是否包角)、功能特征(带支架/磁吸/无线充兼容)、适用机型(精确到iPhone 15 Pro Max)。”

3、实际使用时,从模板库中复制对应段落,粘贴至 Gemini 输入框,再附加当前图片,即可获得定向优化的标签输出。

相关文章

【深度学习】Java DL4J 2024年度技术总结

一、Java DL4J深度学习概述 1.1 DL4J框架简介 1.2 与其他深度学习框架的比较 1.3 DL4J 的优势 1.3.1 与 Java 生态系统的无...

【大模型应用开发

二、大模型的泛化与微调 模型的泛化能力:是指一个模型在面对新的、未见过的数据时,能够正确理解和预测这些数据的能力。在机器学习和人工智能领域,模型的泛化能力是评估模型性能的重要指标之一。...

AI核心技巧:如何重置openclaw硬件设置 openclaw恢复出厂设置操作方法【操作】深度解析|Duuu笔记

重置 OpenClaw 配置有四种方法:一、交互式向导重置(openclaw onboard --reset);二、指定作用域的命令行重置(如--reset-scope config);三、手动删除~...

AI实战详解:Perplexity 怎么做市场调研 Perplexity 市场分析实操教程【商业】最佳实践|Duuu笔记

掌握Perplexity AI市场调研需五步:一、结构化提问嵌入地域/时间/主体/指标四要素;二、限定PDF等原始信源提升可信度;三、分步提问生成制表符分隔文本以自动导入Excel;四、启用Pro S...

前端开发高级应用:Minimax视频生成提示词中文还是英文好实战案例|Duuu笔记

优先使用英文提示词,因其更契合模型训练语料并能稳定触发视觉特征;其次可采用中英混合策略兼顾文化专有名词;纯中文适用于强本土化场景;最终需通过多指标对比验证最优语言形式。 ☞☞☞AI 智能聊天, 问答...

深入理解前端开发:Minimax视频生成黑科技:复杂动作模拟完全指南|Duuu笔记

为精准模拟复杂动作,需采用分帧提示词构建、骨骼关键点引导注入和多阶段动作蒸馏三法:一、将动作拆解为带空间姿态的关键帧序列并加物理约束;二、注入2D/3D关键点坐标锚定关节位置;三、通过粗生成→特征提取...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。