
把狗的叫声翻译成人话,是宠物AI最容易被看懂的产品想象。它也最容易把方向带偏。养宠的人更关心的,是狗此刻到底处在什么状态:它是警觉、焦虑、兴奋,还是身体不舒服。
一只狗在门口叫,主人很容易先想到它想出门。可如果门外刚好有人经过,同一声叫就可能是在警觉。类似的情况也会出现在车里。狗来回走动,看起来像兴奋,但如果车内空间狭小、外部噪音很大,它也可能是在焦虑。声音显然是一条线索,却很难单独给出答案。要判断狗此刻的状态,还要看它在哪里、身体姿态如何、周围有没有陌生人,以及过去遇到类似情况时通常会有什么反应。
也正是在这样的日常判断里,Traini创始人兼CEO孙邻家(Arvin Sun)找到了宠物AI的入口。在BEYOND Expo 2026物理AI峰会“The Rise of Social & Cognitive AI: Transforming Human-Object Interaction”圆桌中,他提到,Traini想建立面向非人类生命的emotional and behavior intelligence(情绪与行为智能),并先从狗开始。

从叫声走向状态,模型需要处理的自然就不再是单一声音。孙邻家提到,Traini已经建立multimodal model(多模态模型),收集并标注宠物行为数据,也与动物行为研究保持合作。叫声、表情、身体语言、健康状态、环境线索和历史行为,会一起进入判断过程。
在模型之外,主人反馈也会参与校准。AI给出的判断如果和主人长期观察不一致,就需要被重新修正。宠物情绪识别不像普通语音翻译,人类语言有明确词汇,狗的表达更依赖身体和环境。一次判断是否可靠,取决于系统能不能把这些线索放到同一张图里。
也正因为要把判断做深,Traini没有急着扩展到所有动物。孙邻家在现场提到,创业公司资源有限,要先把一件事做透。狗本身已经是足够大的市场,美国和欧洲都有庞大的养狗人群;同时,犬类行为研究、数据积累和用户需求,也让它成为更明确的起点。
再往使用场景里看,车内比抽象的“平台层”更容易让人理解。孙邻家提到,手机品牌可能需要pet communication(宠物沟通)或pet mood(宠物情绪)功能,车企也在寻找新的差异化体验。宠物出现在车内时,摄像头、麦克风和扬声器都可能成为模型入口。狗坐在副驾上,主人不一定能随时判断它是紧张、无聊,还是被外部环境吸引。短时间留在车里时,状态变化也需要被及时识别。对车企而言,这类能力不是简单增加一个宠物模式,而是让车内系统更细地理解乘员之外的生命状态。
可一旦AI给出判断,主人也容易把它当成确定答案。宠物无法反驳AI,一次情绪判断却可能影响喂养、训练,甚至就医决策。孙邻家提到,Traini会参考动物行为研究和论文,也重视用户反馈,并为模型设定能力边界。
在他给出的边界里,狗有自己的表达方式,不需要被硬塞进人类语言系统。它可以表达需求、压力、期待和不适,只是表达方式不同。AI要做的,是把这些表达整理成人能够理解的线索,而不是替它编出一句完整台词。