目录:
1.模型设计方法与步骤
2.模型设计原则
3.模型设计思路
4.模型设计制作的原则
5.模型设计概述
6.模型设计原理
7.模型设计分析
8.模型设计怎么写
9.模型设计方案怎么写
10.设计模型的六大原则
1.模型设计方法与步骤
都说做AI产品,不能拿着锤子找钉子。但怎么发现钉子,又怎么能看到哪里要打眼?这篇文章,作者提出了他的一个解法。我们一起来看看。
2.模型设计原则
这篇文章,是写给大模型公司决策者和产品经理的不知道你们会不会有这样的困惑:自家模型能力不错,功能也齐全,完整对标AI头部大厂,为什么就是增长困难,没人用?回答这个问题前,我先讲个小故事在我上篇文章告别AI焦虑,普通人快速上手用好AI大模型的3个关键能力刚发布后,有个前同事主动为我推荐钉钉AI助手,他觉得这产品的“普适性”做的很好,理由是其内置的AI助理模版,能快速帮他设计好角色定位。
3.模型设计思路
而不像其他产品,还要学习提示词,多轮对话才能得到想要的答案而且每次对话都要从0开始,很麻烦
4.模型设计制作的原则
实际上,这个行业的人都知道,钉钉AI助理就是个智能体像智谱清言、文心一言这些产品也都支持,甚至可能效果会更好,但为什么没人为它们发声呢?本质上,这考验的,是产品经理在定义产品时,对需求的洞察深度很明显,很多国内的AI企业,并没有找到合适的需求结合点。
5.模型设计概述
都说做AI产品,不能拿着锤子找钉子但怎么发现钉子,又怎么能看到哪里要打眼?这篇文章,我想提出我的一个解法那就是:先工具,再AI;先入场,再推广;先单点,再泛化怎么理解?我一个个展开聊一、先工具,再AI任何一项新技术的到来,优先改变的是生产力。
6.模型设计原理
无论早期的蒸汽、电力能源,还是如今的互联网和AI,都不例外AI本质上是技术,是一种通过文字理解,快速完成“生成”任务的能力就像互联网背后是TCP/IP,移动互联网底层是5G只靠协议是不够的,只有叠加了浏览器、叠加了移动OS和智能硬件,技术才能真正发挥价值。
7.模型设计分析
因此,AI落地首先要思考的,是能承载“生成”能力的工具该如何设计当然,你可能会说,工具不是有了么?就是个对话框,对话界面就是工具啊但我们可以想想,如果类比PC端的浏览器、移动端的操作系统,一套Chat交互,是否能足够放大AIGC能力?。
8.模型设计怎么写
解这个问题,还要回到ChatGPT本身的含义,人们可能过于注重Chat,而忽略了GPT,也就是「Generative Pre-trained Transformer」生成式预训练变换器这一定义Generative(生成式):目标是学习数据的分布,并能生成与训练数据相似的新数据。
9.模型设计方案怎么写
Pre-trained(预训练):就是总结一般规律的建模过程,本质上是对规则和方法论的整理Transformer(变换器):则能快速准确地理解上下文,并借助自注意力机制生成具备连贯性和可理解性的内容总的来看,GPT模型,是以Transformer架构为基础构建的基于神经网络的语言预测模型。
10.设计模型的六大原则
它可以分析自然语言,并根据对语言的理解预测出*佳的响应回复因此,能理解人类语言,并预测出*佳响应围绕这一抽象概念去设计工具,就可以让AIGC技术有更好的承载那究竟什么样的工具,才更适合大模型落地呢?我们先说什么业务不适合。
凡是不需要信息吸收和传递,只基于想法来完成的生产动作,不太适合和大语言模型结合。如下图:
这类生产动作,从有需求到完成任务,流程极短,且整个流程依赖执行者个人的认知、经验和技巧,期间也不太需要沟通、交流,*后产出实体物或服务体验典型例子是技工、匠人、服务业而需要借助信息理解、传递,完成价值创造的场景,更值得开发对应的AI工具来满足需求。
如下图所示:
这样的流程想高效运转,首先是要多人参与,有一套协作流程;其次在协作时,依赖信息的传递和解读;第三就是信息本身,也是一种可交付的产出物比如内容产业、企业协作流、标准化培训、决策影响,我觉得这些场景会更适合围绕图中圆圈部分上下游开发工具。
二、先入场,再推广工具再好,也要先让人能用起来大语言模型的核心能力,在“生成”,而生成是个动词,为什么生成?生成什么?生成之后怎么办?不解释清楚这3个问题,也是没人愿意用的因此,让工具沉浸在实际工作场景内,先完成用户触达和教育,再逐渐扩大范围,才是更合适的一条路。
拿钉钉AI助手举例,本身钉钉就是强绑定企业内部沟通协作场景的,符合我说的**点:先工具,再AI甚至没有AI,工具照样可用在此基础上,引入模版、插件、提示引导、流程嵌入,让用户潜移默化感受到在AI的辅助下,日常工作效率可以更高,信息的理解、生成效率更高,由于信息不清晰带来的工作失误减少,就会更愿意接受AI功能。
再举个例子,抖音小程序,是抖音生态下一个全新的产品形态单独的抖音小程序中心,就算引流再多,也很少有人愿意主动打开但这不妨碍小程序本身DAU的持续增长背后的原因,就是它很好地和抖音主场景:视频信息流结合在了一起。
视频中提及的信息引发兴趣,想了解更多,用户直接点左下角锚点就可以跳转深入体验,非常顺滑
沿着这个思路,抖音是不是可以在用户发表评论、创作视频、检索信息、管理个人资料这些场景嵌入AI,让信息的创作和理解效率更高呢?刚巧前两天还看到一篇文章,整理了字节的AI产品布局:Zpedia | 字节生AI半年大考,超级APP工厂如何继续跳动?
其中我更看好本身就有完整业务场景的工具,如剪映、巨量引擎、教育AI的引入,可以让视频创作更方便、推广动作更容易、教育过程更有效因此,如果我是AI大模型公司的产品经理,**件事要做的,既不是开发一个AI对话机器人,也不是强化AI生成效果。
而是先切一个有增长潜力的利基市场,围绕特定人群开发内容生成工具,这个工具可以没有AI参与,也能实现需求,再不断叠加大模型能力,延展应用范围比如围绕教师、销售职业,沿着基础业务→泛职场需求→沟通协作场景来开发工具,逐渐渗透AIGC能力帮他们更好完成工作,晋升成长。
三、先单点,再泛化到这里可能你会不服气按这个逻辑,这些基础大模型公司,是不是都要进到某个具体行业,靠项目定制、企业服务挣钱;或者直接开个教育公司、销售公司,别干大模型了?这不越做越窄了?尽管实际上确实如此,但观察现有大模型企业的发展,也有另一条突破路线,就是单点突破。
所谓单点突破,指大模型能力,在某个特性上非常超前,如kimi的超长上下文理解能力,就是个非常好的例子有了这个特性,先让大家眼前一亮,再围绕应用场景展开,告诉用户如何把这个能力应用在日常工作生活中,就会更容易植入用户心智。
当然,这个单点,还可以指某个具体场景,用你的大模型,独一无二,效果巨好比如生成高清质感图像的Midjourney,开源且能定制各种插件的Stable Diffusion国内产品比较靠近这个维度的,像是读音频的通义听悟、搜索场景的秘塔、公文写作的新华妙笔、陪伴社交的MiniMax(星野)等等。
因此,如果基础大模型公司,想向C端打爆自己的品牌和产品能力,要么就是某项能力特别突出,要么就是在某个单点场景做出口碑只卷一些不痛不痒的:读文档、写文案、作图、做PPT等功能,效果有限,就算你体验上改进了很多,也很难有差异化。
对用户而言,你提供的,就只是个AI大模型的实验室,能玩一下、试一下,然后,就该干嘛干嘛了毕竟现阶段大模型的输出,在专业领域只有60-70分,还需要人类花额外精力优化,得不偿失四、battle一下不过上面的3套解法,也许你会提出质疑,觉得我太天真:。
工具先行会带来额外的运营和开发成本,分散精力,也难向投资人交差;融入业务流程会涉及对原有流程的改造,投产比不合适,无法推动;同时也确实找不到合适的单点机会,无论是技术优势还是场景发掘,都需要时间打磨是的,但这不是产品经理挖不到AI价值点的借口。
对于想在这方面有所突破的产品经理,我再提出一个解法:重新定义AI业务流我提出的3个解法,是基于对现有业务流的改造升级,以AI+的方式设计产品但有没有一种场景,是专门为AI设计,也能实现一套完整业务流的?。
当然有比如当下流行的AI Agent自动化流程此外,数字人也是:声音克隆+形象克隆+口型匹配+剪辑拼接几个流程组合的产物再或者,有没有现存工作流之外,能靠AI技术很好解决的新需求?当然也有有篇来自纽约时报的*新报道《医生们正在以意想不到的方式使用聊天机器人》,其中提到,专家原本期望ChatGPT和其他基于人工智能的大型语言模型能承担医生花费大量时间的例行工作,如撰写医保理赔申诉或总结患者笔记,从而减轻医生的工作压力和疲劳。
然而,医生们却要求ChatGPT帮他们以更富同情心的方式与患者进行沟通借助聊天机器人,医生用它来寻找用于传达坏消息、表达对患者痛苦的关切,或者更清晰地解释医疗建议的措辞这样的流程,就是脱离现有业务之外,由AI可以发起的新场景。
这些场景,都值得每一名AI产品经理关注五、结语*后,我想以一句口诀来帮你记住这篇文章我提出的3套解法:工具为舟,AI为帆;入场为港,推广为航;单点起航,泛化扬帆这句记忆口诀,是我基于对“好内容”的理解,在写文章时向AI提出的需求,AI也很好地完成了这个任务。
但有没有一款大模型,能直接把这个创作场景融入写作流程,我**个申请试用和推广!互动一下你用过的大模型产品,有没有符合“先工具,再AI;先入场,再推广;先单点,再泛化”特点的?期待你的分享与我讨论如果你觉得这篇文章有启发,也欢迎分享给身边做大模型的企业和产品经理~。
专栏作家申悦,微信公众号:互联网悦读笔记(ID:pmboxs),人人都是产品经理专栏作家,前360产品总监,起点学院优秀导师本文原创发布于人人都是产品经理未经作者许可,禁止转载题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。