当前位置:首页 > AI技术 > 正文内容

开发怎么 Gemini 批量标注图片?电商卖家提升上架效率的教程案例|Duuu笔记

admin1周前 (04-06)AI技术21

基于真实项目经验的前端实战分享

电商卖家可通过Gemini实现商品图批量标签化:一、结构化整理图片并建CSV;二、用AI Studio逐张调用API输出JSON标签;三、Python脚本自动批量处理;四、Chrome扩展人机协同标注;五、建立类目化提示词模板库提升精度与复用性。

如果您是电商卖家,需要为大量商品图片添加标签以提升上架效率,但手动标注耗时费力,则可以借助 Gemini 的多图理解与文本生成能力实现半自动化批量标注。以下是具体操作路径:

一、准备结构化图片数据集

Gemini 本身不支持直接上传数百张图片并一键生成全部标签,需通过编程接口或分批交互方式调用其视觉理解能力。因此,第一步是将待标注图片整理为可被程序读取的结构化形式,确保命名规范、格式统一,并预留标签存储位置。

1、将所有商品图片存入同一本地文件夹,文件名不含空格与特殊符号,例如“dress_blue_001.jpg”“shirt_cotton_002.png”。

2、确认图片尺寸适中(建议长边≤2048像素),避免因超分辨率导致 Gemini API 拒绝解析或返回截断结果。

3、创建一个空的 CSV 文件,列名为“filename,category,color,material,style,description”,用于后续写入 Gemini 输出的标签字段。

二、使用 Google AI Studio 调用 Gemini Pro Vision API

通过 Google 提供的 AI Studio 平台,可调用支持图像输入的 Gemini-1.5-flash 或 Gemini-1.5-pro 模型,逐张发送图片并获取结构化文本响应。该方式无需本地部署,适合无开发经验但熟悉网页操作的卖家。

1、访问

https://aistudio.google.com/

并登录关联 Google Cloud 账号。

2、在左侧菜单选择“Get API key”,创建新密钥并复制保存;注意启用 billing 及 Gemini API 配额。

3、在 Playground 区域选择模型为

gemini

-1.5-flash

,点击“Add image”上传单张商品图,然后在提示框中输入:

“请用 JSON 格式输出以下6项:品类、主色、材质、风格、适用场景、简短卖点描述。字段名用英文小写,值用中文,不要额外解释。”

4、点击“Run”获取响应,复制 JSON 内容,粘贴至 CSV 对应行,完成单图标注。

三、用 Python 脚本批量调用 Gemini 多模态接口

对具备基础代码能力的用户,可通过 Python 调用 google.generativeai 库,循环读取文件夹内图片,自动构造请求、解析 JSON 响应并写入 CSV。此方法真正实现“批量”,单次运行可处理 50–100 张图片(受速率限制约束)。

1、安装依赖库:

pip install google-generativeai pandas

2、在脚本开头设置 API 密钥:

genai.configure(api_key="YOUR_API_KEY")

元典智库

元典智库:智能开放的法律搜索引擎

下载

3、定义 prompt 模板,固定要求输出字段与格式,例如:“你是一名资深电商运营,请针对这张商品图,严格按以下 JSON Schema 输出:{"category":"string","color":"string","material":"string","style":"string","occasion":"string","selling_point":"string"}。”

4、遍历图片路径列表,对每张图调用

model.generate_content([image, prompt])

,捕获 response.text,用 json.loads() 解析后追加到 DataFrame。

四、利用 Gemini Chrome 扩展快速人工辅助标注

对于图片数量在 20–50 张以内、且需兼顾语义准确性的中小卖家,可采用“人机协同”模式:用浏览器扩展快速唤起 Gemini 视觉分析,人工校验后一键复制标签,跳过编程环节。

1、在 Chrome 应用商店安装官方认证的

“Gemini for Google Search” 扩展

(图标为蓝白双色对话气泡)。

2、打开商品图片所在网页或本地 HTML 预览页,右键点击任意图片,选择“Ask Gemini about this image”。

3、在弹出侧边栏中输入指令:

“列出5个适合电商平台搜索的关键词,按相关性降序排列,用顿号分隔”

4、复制返回结果,粘贴至 Excel 表格对应单元格,批量填充后统一整理为标准标签字段。

五、构建本地提示词模板库提升复用性

不同类目商品需差异化提示词才能获得高精度标签。例如服饰强调版型与穿搭场景,数码配件侧重接口类型与兼容型号。建立分类提示词库可减少每次重复编辑,确保标签维度一致。

1、新建文本文档,命名为“prompt_templates.txt”,按类目分段落,如【女装】下写:“请识别图中服装的领型、袖长、裙长、季节适配性、搭配建议,忽略模特妆容与背景。”

2、【手机壳】类目下写:“提取产品图中的材质工艺(如磨砂PC、液态硅胶)、防护等级(是否包角)、功能特征(带支架/磁吸/无线充兼容)、适用机型(精确到iPhone 15 Pro Max)。”

3、实际使用时,从模板库中复制对应段落,粘贴至 Gemini 输入框,再附加当前图片,即可获得定向优化的标签输出。

相关文章

【大模型应用开发

二、大模型的泛化与微调 模型的泛化能力:是指一个模型在面对新的、未见过的数据时,能够正确理解和预测这些数据的能力。在机器学习和人工智能领域,模型的泛化能力是评估模型性能的重要指标之一。...

使用 ESP

针对该分类问题,我们使用了 Kaggle 手势识别数据集 中的一个开源数据集。原始数据集包括 10 个类别,我们只使用了其中 6 个。这些类别更容易识别,且日常生活中更有用,如...

神经网络分类总结

从网络性能角度可分为连续型与离散型网络、确定性与随机性网络。 从网络结构角度可为前向网络与反馈网络。 从学习方式角度可分为有导师学习网络和无导师学习网络。 按连续突触性...

神经网络中的单层神经网络

神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。 看一个经典的神经网络。这是一个包...

什么是人工智能 ?

您可以使用 ML 训练 AI,使其精确、快速地执行任务。这可以通过自动化员工感到吃力或厌烦的业务部分来提高运营效率。同样,您可以使用 AI 自动化来腾出员工资源,用于更复杂和更具创造性的工作。...

几种主要的神经网络

卷积神经网络的输入为二维的像素整阵列,输出为这个图片的属性,当网络训练学习后,所输入的图片或许经过稍微的变换,但卷积神经网络还是可以通过识别图片局部的特征而将整个图片识别出来。 :该层...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。