当前位置:首页 > AI技术 > 正文内容

如何用 Gemini 识别食物照片并自动生成营养分析报告指南最佳实践|Duuu笔记

admin3周前 (03-29)AI技术20

可通过三种路径实现食物照片营养成分识别:一、Gemini App直接上传图片并提问;二、Google Lens识别食物名后,用Gemini网页端深度分析;三、开发者用预处理图像调用Gemini API生成结构化营养报告。

如果您拍摄了一张食物照片并希望快速获取其营养成分信息,则可能是由于缺乏直接调用 Gemini 视觉识别与营养数据库联动的标准化流程。以下是实现该目标的具体操作路径:

一、通过 Gemini App 直接上传图片并提问

此方法依赖 Gemini 移动端应用内置的多模态理解能力,可对食物图像进行视觉解析,并基于训练数据中的常见食物特征推断品类及大致营养构成。

1、在手机应用商店下载并安装官方 Gemini 应用(需确保为 Google 发布的正版应用)。

2、打开应用后登录已启用 Gemini Advanced 权限的 Google 账户。

3、点击输入框旁的“图片图标”,从相册选择一张清晰、主体明确的食物照片。

4、在文字输入框中键入:

“请识别这张食物照片,并列出主要食材、估算每100克的热量、蛋白质、脂肪和碳水化合物含量”

5、发送请求,等待 Gemini 返回结构化文本响应。

二、使用 Google Lens + Gemini 网页端协同分析

当 Gemini App 对复杂摆盘或非标准食物识别准确率较低时,可先通过 Google Lens 提取高置信度的食物名称,再将结果作为提示词输入 Gemini 网页端进行深度营养扩展。

1、在 Android 设备上长按食物照片,选择“Google Lens”选项;iOS 用户需打开 Google App 并点击镜头图标上传图片。

独响

一个轻笔记+角色扮演的app

下载

2、等待 Lens 返回最匹配的食物名称(例如“宫保鸡丁”或“牛油果吐司”)。

3、访问

gemini

.google.com,在对话框中输入:

“根据 Google Lens 识别出的食物‘宫保鸡丁’,提供一份典型家常做法下的每份(约300克)营养成分分析,包括热量、蛋白质、脂肪、碳水、钠和膳食纤维”

4、确认 Gemini 引用的是通用烹饪数据库(如 USDA FoodData Central)中的对应条目。

三、借助第三方工具预处理图像后接入 Gemini API

面向开发者或高级用户,可通过图像裁剪、背景去除、光照归一化等预处理提升识别稳定性,再调用 Gemini Pro Vision API 实现定制化营养报告生成。

1、使用 Python 调用 OpenCV 或 PIL 对原始食物图进行中心区域裁剪与白平衡校正。

2、将处理后的图像 base64 编码,并构造包含 system instruction 的 API 请求体,其中明确要求输出 JSON 格式营养字段。

3、在请求中嵌入约束条件:

“仅输出标准营养标签字段:name、serving_size_g、calories_kcal、protein_g、fat_g、carbs_g、fiber_g、sodium_mg;不添加任何解释性文字或额外字段”

4、接收 API 响应后,将 JSON 数据导入本地 Excel 或 Markdown 模板自动生成可视化报告。

相关文章

【深度学习】Java DL4J 2024年度技术总结

一、Java DL4J深度学习概述 1.1 DL4J框架简介 1.2 与其他深度学习框架的比较 1.3 DL4J 的优势 1.3.1 与 Java 生态系统的无...

【大数据分析 | 深度学习】在Hadoop上实现分布式深度学习

一、Submarine(Hadoop生态系统) (一)Submarine 介绍 (三)Submarine 属于 Hadoop 生态系统 (四)Submarine 官网版...

神经网络中的单层神经网络

神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。 看一个经典的神经网络。这是一个包...

一文讲清神经网络、BP神经网络、深度学习的关系

人工神经网络中的顶级代表。往往说《神经网络》就是指《BP神经网络》。 大家研究着各种神经网络,研究得不亦乐乎, 来了两个家伙Romelhart 和Mcclelland,...

前端开发实战详解:骡子快跑怎么注册账号 骡子快跑账号注册流程最佳实践|Duuu笔记

骡子快跑注册仅需1分钟,但激活码需从Discord指定频道获取,输错3次将锁账户24小时;积分与注册邮箱强绑定且不可更换;部分地区即使注册成功也无法运行Agent。 ☞☞☞AI 智能聊天, 问答助手...

bp神经网络是什么网络,神经网络和bp神经网络

1、前馈神经网络:一种最简单的神经网络,各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层.各层间没有反馈。 2、BP神经网络:是一种按照误差逆向传播...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。