开搜AI资讯-2024年8月12日
讯飞智文2.0版本发布:内置AIPPT编排创作引擎,基于星火大模型
从讯飞开放平台获悉,讯飞智文2.0版本今天正式发布,带来PPT文本生成大模型、AIPPT编排创作引擎、AI-n-PPT在线编辑模组三大技术升级。据介绍,讯飞智文2.0依托讯飞星火V4.0的底座能力,在文本生成方面进行了-n-独立训练,对用户输入的主题具备更强大的理解能力。用户在“主题创建“中输入一句话主题,再勾选“联网搜索”,-n-大模型即可自动抓取实时资讯,以确保事实的时效性、准确性。
来源:讯飞开放平台
毒舌AITwitterPersonality每小时赚4000美元,每分钟36个新用户
病毒式传播的”毒舌AITwitterPersonality每小时赚4000美元!(约2.8万元),只需输入一个推特用户名,就能得-n-到AI根据历史发言做的犀利点评。而且只要是公开账号就行,并不需要获取任何权限,除了查看AI对自己的看-n-法,还可以用来恶搞朋友,甚至名人。“毒舌AI"TwitterPersonality构建在低代码开发平台Wordware上。-n-来源:Q量子位-n-马斯克宣布Grok2测试版即将发布,年底发布Grok3-n-特斯拉CEO马斯克当地时间8月11日晚在×平台上表示,人工智能模型Grok2测试版即将发布。Grok2发布后-n-将紧随Grok3,马斯克此前称其将在年底左右推出。他表示,XAI一直在训练Grok3,该模型的水平将"达到或超-n-越”尚未发布的OpenAIGPT-5
来源:IT之家
AI换脸项目Deep-Live-cam一夜爆火
只需一张照片,变身马斯克直播-n-8月9日晚到8月10日早晨,一个项目突然在GitHub上火起来:Deep-Live-Cam,使用一张他人的照片,就能-n-实现在直播流中的实时换脸,而且效果优秀。Deep-Live-cam现在在GitHub上完全开源,在CPU上运行,可以-n-使用NVIDIACUDA、Apple Silicon(CoreML)、DirectML(Windows)、OpenVINO(Intel)进行GPU加速。
来源:AI工具集
摩根大通人工智能助手已供超过 6 万名员工使用
来源:36 氪
据报道,摩根大通向其数万名员工推出了一款生成式人工智能助手,这是将该技术嵌入整个银行的计划初始阶段。这个名为 LLM Suite 的程序已经帮助 6 万多名员工完成了写电子邮件和报告等任务。(第一财经)
北京航空航天大学发布了 “小航”AI 助手
来源:ITSoul
北京航空航天大学发布了 “小航”AI 助手,“小航” 具有创新特色。它有全国产超大规模的智算平台这一“超强大脑”,硬件资源部署在北航杭州国际校园,有高可靠等优势,配备百台千卡智算集群,算力达 200 PFlops,存储能力达 12PB 能满足师生需求;运用自研技术实现“学汇百家”,激发智慧涌现能力;通过人 - 机持续协同学习技术达成“智能混合”,构建私域数据空间,缓解 AI 长期记忆问题,增强知识吸收能力;还能做到“千人千面”,为师生、课程组等提供个性化优质服务,与大家共同成长为领域专家。
中国司法大数据研究院:首个通过中国法考的 AI 模型 “法观”
来源:ITSoul
中国司法大数据研究院发布,“法观”AI 大模型产品通过中国法律职业资格考试,客观题 182 分且主观题表现优秀。中国司法大数据研究院紧跟大模型应用发展趋势开展前瞻布局,“万法”大模型已积累沉淀一年多并开始对外提供服务,“法观”基于 “万法” 大模型,由多单位联合设计研发和部署,已开放公测。Lawbench 测试中 “法观” 得分 64.38 分暂列全球第一,Lawbench 是由南京大学和上海人工智能实验室联合构建的中文法律问答模型评估数据集,包含三个关键维度和 20 个子测评项及五大类法律专业任务,“法观”是全球首个通过中国法考的人工智能产品,学习资料中无考试题目,属真考。
字节豆包大模型支持实时语音通话
来源:ITSoul字节跳动
旗下火山引擎宣布推出对话式 AI 实时交互解决方案,该方案搭载火山方舟大模型服务平台,通过火山引擎 RTC 进行语音数据相关操作,整合语音识别和合成模型,提供智能对话和自然语言处理能力以实现用户和云端大模型实时语音通话。其支持开箱即用快速搭建,只需调用 OpenAPI 接口配置相关参数,火山引擎AIGC RTC-Server 负责多个环节。该技术有三大亮点,包括支持随时打断插话、响应延时低至 1s、客户端有音频帧级别的语音活动性检测功能。
谷歌:发布首个达到人类竞技水平的乒乓球 AI 机器人
来源:ITSoul
在巴黎奥运会乒乓球团体赛期间,谷歌发布首个达到人类竞技水平的乒乓球 AI 机器人。正反手能灵活转换,能接擦网球、高球等,专业教练称其达到中级选手水平。实际测试中,它能实时适应不同选手风格,赢下了与初学者的所有比赛,与中级玩家对打有 55% 的胜率,乒乓球是对体力、战略和技巧综合要求高的运动,机器人打乒乓球面临如高速运动、实时精准控制、战略决策、系统设计等考验,比如要根据球的落点快速移动位置、判断出界球是否接球等。团队找了 29 个不同技能水平的运动员与机器人比赛,比赛遵循标准乒乓球规则(机器人无法发球由人类发球)。采用 6 自由度的 ABB 1100 机械臂,装置在两个 Festo 直线导轨上,机械臂装配 3D 打印的球拍手柄和覆盖短颗粒胶皮的球拍。使用结合强化学习和模仿学习的混合训练方法,设计了分层和模块化的策略架构,包括低级技能库(LLC)和高级控制器(HLC)。LLC 用进化策略算法在仿真环境中训练执行特定乒乓球技能的策略,HLC 负责选择合适的 LLC,还采用在线学习适应对手特点。先收集人类比赛数据设置初始化任务条件,用强化学习在模拟环境训练再部署到真实世界,通过模拟与现实结合循环改进技能,机器人还能追踪对手适应不同对手,不过它存在不擅长处理下旋球的弱点。
华为 AI 消除目前仅支持三款机型:Mate60 系列等暂不支持
来源:站长之家
华为终端 BG CTO 李小龙展示了华为 Pura 70 Ultra 的 AI 消除功能。
从效果来看,华为 Pura 70 Ultra 可以精准识别水面上的杂乱部分,并一键消除,处理后的照片完全没有涂抹痕迹。
据了解,华为 AI 消除不但可以精准地去除人物,还能在相应部分生成、弥补非常自然的背景,和实际拍到的部分融合得非常好,基本看不出涂抹、拼接的痕迹。
刘作虎宣布 OPPO 手机接入谷歌AI大模型,Gemini:AI 方面的成果难以置信
来源:站长之家
刘作虎在社交平台上宣布,OPPO 手机接入谷歌 AI 大模型 Gemini。
刘作虎表示,我们与谷歌密切合作,取得了令人难以置信的 AI 成果,我们致力于让每个人都能拥有 AI 手机,我们正在不懈努力地实现这一目标。
据了解,在 Google 开发者大会上,谷歌正式推出全新的 Gemini 1.5 Flash AI 大模型,这是谷歌迄今为止最快、最经济的模型,适合处理高容量任务。
据悉,Gemini 1.5 Flash 擅长摘要制作、聊天应用、提供图说和视频字幕以及从长篇文件和表格中提取数据等任务。
该模型是通过 Gemini 1.5 Pro 的训练过程进行提取得到的,即把大模型中的核心知识和技能转移到这个较小但更高效的模型上。
值得一提的是,接入谷歌 Gemini 的是 OPPO 国际版机型,国行版将使用 OPPO 自研 AI 大模型。
OpenAI 付费功能免费用!却被网友无情嘲讽
来源:站长之家
OpenAI 宣布,将向免费用户开放其 {tag_keyurl_3} 3 模型的图片生成功能,但这一决策并未收获预期的好评,反而在网上引发了激烈的讨论和嘲讽。
而最主要的原因,就是用户每天仅可以生成两张图片。
DALL-E 3 模型自去年 9 月推出以来,一直作为 ChatGPT Plus 付费订阅用户的专属功能,对于超出次数的用户,ChatGPT 会提示升级到 ChatGPT Plus 或等待第二天使用。
对此有网友认为,每天两次的免费使用次数相对较少,竞争力不足,市面上存在许多同类型产品,且提供了更多的免费使用次数,如 Bing 等。
还有网友毫不客气地讥讽道,一分钱一分货,只需订阅 Midjourney,你以后会感谢我的。
一些网友直言不讳地指出,OpenAI 的这一举措更像是一种营销手段,而非真正的免费开放。