全球数字财富领导者
财富汇
|
美股投研
|
客户端
|
旧版
|
北美站
|
FX168 全球视野 中文财经
首页
资讯
速递
行情
日历
数据
社区
视频
直播
点评旗舰店
商品
SFFE2030
外汇开户
登录 / 注册
搜 索
综合
行情
速递
日历
话题
168人气号
文章
美银行“爆雷”可怕一幕!VC传奇蒂尔与多家风投:快从硅谷撤资 分析师却喊逢低布局?
go
lg
...
识为19美元。” Bloomberg
Intelligence
分析师Herman Chan指出,此次出售“考虑到该银行有能力为存款融资提供资产负债表外客户资金,这令人感到意外”。 为缓解冲击,SVB将通过普通股、存托股份和向General Atlantic出售股份筹集22.5亿美元。 在较早的一份报告中,Chan指出SVB在其910亿美元的持有至到期证券投资组合中,面临150亿美元的未实现亏损头寸。 正如Lake Cornelia Research Management继续指出的那样,这种情况的市场影响是深远而广泛的。 (来源:推特) “我们有210亿美元的资产负债表,两年前仅为860亿美元,很可能会放松。可以毫不夸张地说,在当前按市值计价的基础上,股本为负数达数十亿美元。你可能资不抵债,但流动性强,可以作为一家银行生存。受损或被击败的SIVB对创业生态系统的打击将是巨大的。” “除了我们强调的负面久期风险,资产方锁定在200个基点以下,而负债方可能增加到200个基点以上,HTM的简单市值计价以及880亿美元的HTM和700亿美元的贷款,可能远大于以18亿美元价格出售AFS证券的已实现亏损。2020年以来的资产增长是疯狂的,在JPM出价时,SIVB的总资产是BSC的50%。” “我们认为,当这一切都完成后,看到SIVB达到每股50美元或更低的价格并不疯狂,”ZeroHedge分析文章写道。 更高的存款利率以及逃离私人银行客户的可能性带来的负收益循环,还有相关的资产负债表压力是一个黑暗的场景。在许多情况下,他们需要筹集更多资金,对现有持有人进行稀释,而这可能无法解决问题。 “我们很少看到在当天下跌40%时,买入一家银行是一个不错的入场点,这些事情的平息速度可能比人们意识到的要快得多。” 仅仅将20221-22年持有贷款和HTM证券的增长价值削减10%,账面权益就会减少50亿美元。 看到今天优先股交易量下跌15%,应该会让许多人大开眼界。关键是市场认为这还没有结束,还有很多二阶和三阶影响。#硅谷银行爆雷#
lg
...
小萧
2023-03-10
ChatGPT热潮之下 虚假新闻、算法歧视、信息泄露的法律风险你了解吗?
go
lg
...
能内容生产赛道(Artificial
Intelligence
Generated Content)的热潮。微软已正式将ChatGPT技术接入必应搜索和Edge浏览器。百度(中国)有限公司也表示,将在今年3月完成类似ChatGPT的项目“文心一言”(ERNIE Bot)的内部测试后向公众开放。 对于ChatGPT展现的“超能力”,不少人对技术发展感到振奋的同时,也对人工智能内容生产及其背后的道德伦理、社会责任和法律风险存在一丝担忧。本文将从算法、数据和内容三个层面,详述ChatGPT背后的法律风险和合规建议。 一、ChatGPT生成虚假信息,谁来为答案质量负责? ChatGPT的技术原理是在算法和数据基础上,利用自然语言处理生成相应回答。具体来说,ChatGPT使用了基于人类偏好的强化学习的机器训练模型(Reinforcement Learning from Human Feedback),由技术人员预先给ChatGPT输入海量语言数据,并根据人工标注的高质量回答对ChatGPT生成的回答建立打分和奖励模型,引导训练ChatGPT模型对输出结果不断进行校正和优化,并向高分方向完善输出答案,最终使得ChatGPT能够学习人类语言的特征和结构,实现用自然语言进行人机交流。 当前,ChatGPT被认为能够处理多种相对复杂的语言类工作,包括自动文本生成、自动问答、延续上下文的连续对话等,并被尝试用于新闻、营销、客服等行业领域。但是,人工智能内容生产并不能保证其内容的准确性,ChatGPT也在用户协议中对此做出了免责声明。比起ChatGPT输出一些“正确的废话”,其“一本正经地胡说八道”带来的危害更是令各国监管机构都十分警觉。 今年1月,OpenAI首席技术官米拉·穆拉蒂(Mira Murati)表示,ChatGPT可能会被“危险分子”使用于编造事实,这是当下大型语言模型共同面临的挑战。 一方面,在法律、医学等专业领域,用户需要一定的专业知识才能辨别ChatGPT生成内容的真假。如有用户依赖不准确的答案做出判断和决策,可能会危害用户的人身和财产安全。 另一方面,不排除一些别有用心的不法分子,通过向ChatGPT输入虚假或误导性的信息来“训练”其产生虚假信息,严重者可能导致影响政治舆论或政治生态、煽动暴力和犯罪等破坏公共利益等严重后果。 我国出台的《互联网信息服务深度合成管理规定》,也是旨在应对深度合成技术给法律、社会秩序、公共安全带来的冲击。根据《互联网信息服务深度合成管理规定》给出的定义,深度合成技术是指利用深度学习、虚拟现实等生成合成类算法制作文本、图像、音频、视频、虚拟场景等网络信息的技术,其中包括篇章生成、文本风格转换、问答对话等生成或者编辑文本内容的技术。ChatGPT这类人工智能内容生产产品,显然应受该法的规制。 按照《互联网信息服务深度合成管理规定》要求,深度合成服务提供者应当落实信息安全主体责任,建立健全用户注册、算法机制机理审核、科技伦理审查、信息发布审核、数据安全、个人信息保护、反电信网络诈骗、应急处置等管理制度。 首先,深度合成服务提供者应当以显著方式提示深度合成服务技术支持者和使用者承担信息安全义务。对于使用其服务生成的可能导致公众混淆或者误认的信息内容,应当在该信息内容的合理位置、区域进行显著标识,向公众提示该内容为深度合成,并在生成疑似违法信息时提示用户存在虚假信息的安全风险。 其次,深度合成服务提供者应当加强深度合成内容管理,建立健全用于识别违法和不良信息的特征库,采取技术或者人工方式对深度合成服务使用者的输入数据和合成结果进行审核。如果发现用户利用深度合成服务制作、复制、发布、传播虚假信息的,应当及时采取辟谣措施,保存有关记录,并向网信部门和有关主管部门报告。 与此同时,对发布违法和不良信息的相关深度合成服务使用者,要依法依约采取警示、限制功能、暂停服务、关闭账号等处置措施。 二、ChatGPT生成歧视性文本,算法盲盒如何监管? 除了《互联网信息服务深度合成管理规定》,ChatGPT等人工智能内容生产产品也受《互联网信息服务算法推荐管理规定》规制。《互联网信息服务算法推荐管理规定》中所称算法推荐技术,就包括利用生成合成类算法技术向用户提供信息。该法规的要点,是防止出现算法歧视或算法偏见,生成负面有害信息或低俗劣质信息等不符合主流价值导向的内容。 根据《互联网信息服务算法推荐管理规定》第七条规定,算法推荐服务提供者应当建立健全算法机制机理审核、科技伦理审查、用户注册、信息发布审核、数据安全和个人信息保护、反电信网络诈骗、安全评估监测、安全事件应急处置等管理制度和技术措施。 具体来讲,算法服务提供者应当定期审核、评估、验证算法机制机理、模型、数据和应用结果,确保算法模型不违背伦理道德。在此基础上,算法服务提供者同样应以显著方式告知用户其提供算法推荐服务的情况,并以适当方式公示算法推荐服务的基本原理、目的意图和主要运行机制等。 此外,如果是具有舆论属性或者社会动员能力的产品,算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续。 以ChatGPT为例,尽管OpenAI在官网上声明,ChatGPT已通过算法设置和训练,能在一定程度上拒绝用户不合理的请求,例如生成可能包含种族歧视或性别歧视、暴力、血腥、色情等违反法律以及公序良俗的内容。但事实上,这样的违法信息传播风险仍然存在,其引发的法律责任和社会舆论,可能会对公司形象及商誉产生负面影响。 三年前在韩国十分火爆的人工智能聊天机器人Lee Luda,由于一些用户在对话交互时,故意输入污秽和暴力言语,导致Lee Luda在接收这些不符合主流价值观的内容后,开始输出一些涉嫌性别歧视、种族歧视、对弱势群体的歧视的内容,该产品因此广为诟病而于上线不到一个月就中断了服务。 三、用户的输入信息被用来训练ChatGPT,个人信息处理合规要点何在? ChatGPT的前期训练、后期迭代和强化学习都需要海量的数据,最新开放版本GPT-3.5预训练数据量已达到45TB,其中就包括北京智源人工智能研究院建构的中文语料库WuDaoCorpora中约3TB的中文语料。 《互联网信息服务算法推荐管理规定》第十四条明确规定,深度合成服务提供者和技术支持者应当加强训练数据管理,采取必要措施保障训练数据安全;训练数据包含个人信息的,应当遵守个人信息保护的有关规定。 我国《个人信息保护法》明确了处理个人信息应当遵循的公开原则、诚信原则和最小限度原则,即个人信息处理者应当公开个人信息处理规则,明示处理的目的、方式和范围,不得过度收集个人信息,不得通过误导、欺诈、胁迫等方式处理个人信息。以ChatGPT为例, OpenAI公司为模型训练而收集或处理个人信息的,还需要取得用户个人的同意。 在OpenAI公司就ChatGPT使用常见问题的答复中,OpenAI明确承认,用户与ChatGPT的对话数据,将会被用于ChatGPT的迭代模型训练。并且,OpenAI特别提示,OpenAI暂时无法从输入历史中删除特定某条内容;如果想要删除数据,必须以注销此OpenAI账号的方式,而该账号所有的相关数据会被一起删除,故用户不要在使用ChatGPT时输入敏感信息或机密内容。 因此,在类似ChatGPT的人工智能内容生产产品开发和后期升级过程中,尽可能使用公开的非个人信息,或对收集的个人信息进行匿名化的处理。如果必须要使用个人信息,应当明确向用户告知并取得其个人同意,避免违法使用个人信息造成的侵权或损害。 来源:金色财经
lg
...
金色财经
2023-03-09
Supermicro与Rakuten Symphony扩大合作范围,为云端型Open RAN移动网络提供完整的5G、电信和边缘解决方案
go
lg
...
2x E810和1x XXV710,双
Intel
Xeon Platinum 8358P CPU,具有高弹性和插槽数、NUMA平衡架构、完整的软件整合/管理功能支持。 O-DU:SYS-210TP-HPTR,2U4N
Intel
Xeon Gold 6338N,含32核心、1x ACC100和1x XXV710单插槽,具有高密度、超低封包处理延迟。 O-DU:SYS-210P-FRDN6T,2U
Intel
Xeon Gold 6338N,含32核心、1x ACC100和1x XXV710单插槽低矮型、超低封包处理延迟。 Rakuten Symphony将开始在下列相同尺寸的服务器中提供搭载第4代
Intel
Xeon可扩展处理器的Supermicro 服务器: 用于CU和DU的特定Supermicro X13产品: CU:SYS-221H-TNR CU:SYS-221HE-FTNRD DU:SYS-111E-FDWTR DU:SYS-211E-FRDN2T 进一步了解Supermicro X13产品,请访问:www.supermicro.com/x13 进一步了解Supermicro和Rakuten Symphony,请访问:https://www.supermicro.com/en/solutions/rakuten-symphony 需了解MWC 2023会场上的Supermicro和Rakuten Symphony解决方案,请莅临Supermicro/Rakuten 展台,5 厅,编号5D66 关于Super Micro Computer, Inc. Supermicro (NASDAQ:SMCI) 是应用优化全方位IT解决方案的全球领导者。成立于美国加州圣何塞,Supermicro致力于为企业、云计算、人工智能和5G 电信/边缘IT 基础架构提供领先市场的创新技术。Supermicro正转型为全方位IT 解决方案提供商,完整提供服务器、人工智能、储存、物联网和交换机系统、软件和服务,同时继续提供先进的大容量主板、电源和机箱产品。Supermicro 的产品皆由企业内部设计和制造,通过全球化营运展现规模和效率,并优化以提高 TCO及减少对环境的影响(绿色计算)。屡获殊荣的Server Building Block Solutions 产品组合能让客户从灵活且可重复使用的构建区块所打造的广泛系统系列中选择,支持各种规格、处理器、内存、GPU、储存、网络、电源和散热解决方案(空调、自然气冷或液冷),进而针对客户实际的工作负载和应用实现最佳性能。 Supermicro、Server Building Block Solutions 和 We Keep IT Green 皆为 Super Micro Computer, Inc. 的商标和/或注册商标。
Intel
、
Intel
标志及其他
Intel
标记皆为
Intel
Corporation 或其子公司的商标。 所有其他品牌、名称和商标皆为其各自所有者之财产。
lg
...
美通社
2023-03-07
15年来未曾见过的一幕:美国的银行们展开“揽储大战”!
go
lg
...
0%。 彭博资讯(Bloomberg
Intelligence
)银行信贷策略师Arnold Kakuda表示,受融资成本上升影响最大的是社区银行和规模较小的地区性银行。 当美国最大的银行和主要的地区性银行失去存款时,它们往往可以在全球债券市场上借入更多资金。但规模较小的地区性银行和社区贷款机构的选择较少,它们往往不得不争取更多的存款,或者从联邦住房贷款银行系统(Federal Home Loan Banking System)获得更多资金。 据BI报道,大型银行可能不需要改变债券发行计划,但USBancorp和Truist Financial Corp.等较大的地区性银行可能需要在债券市场上借入更多资金。Kakuda估计,未来几年,他们每年可能需要出售高达100亿至150亿美元的资产,但这笔资金对他们来说应该是可控的。 在银行资产负债表的资产方面,随着美国经济设法避免出现实质性放缓,贷款继续增长。这些贷款需要资金,而存款是银行融资的主要来源。 美联储最近的一项调查暗示,随着融资压力的增加,银行可能会采用一些策略来弥补损失的资金。在调查问卷中,金融机构报告称,如果准备金下降到令人不安的水平,它们将在无担保融资市场借款、筹集经纪存款或发行CD。绝大多数国内银行还表示,从联邦住房贷款银行提前借款“非常有可能”或“有可能”。 安永(Ernst & Young)全球银行和资本市场部门主管Jan Bellens表示,最终,银行可能不得不继续提高存款利率,因为它们要与其他收益率更高的投资进行竞争。 Bellens说道:“银行将不得不为存款支付更高的费用。如果客户对他们得到的利率不再满意,他们就会开始逐渐转移存款,这就是为什么银行非常热衷于用CD产品锁定消费者。”
lg
...
风枫
2023-03-07
大型基金大幅减持AMD、英特尔、英伟达和美光等芯片股
go
lg
...
今年,数据中心的进展和竞争对手英特尔(
Intel
)日益脆弱的处境提振了AMD的股价。 英特尔在2月底宣布削减66%的股息。巴伦认为,这是“一个积极的迹象,表明管理层正在承认这家芯片制造商的不稳定状况。”英特尔首席执行官帕特·盖尔辛格今年一直在购买该公司的股票,无论是在宣布削减股息之前还是之后。 CDPQ在第四季度出售了140万股英特尔股票,该季度结束时持有550万股。英特尔的股价在2022年下跌了49%,今年迄今为止股价持平。截至去年第四季度末,该基金共出售了512,139股英伟达股票,持有140万股。英伟达的股价在2022年下跌了50%,到2023年为止,股价上涨了63%。 投资者对人工智能的狂热支撑了英伟达的股价。英伟达(Nvidia)首席执行长黄仁勋(Jensen Huang)就是从股价飙升中受益的一名股东,他减少了曾经大量出售的股票。该公司表示,其视频游戏相关业务的复苏将是另一个催化剂。 内存芯片制造商美光科技(Micron)的首席财务长3月早些时候警告称,当前季度前景疲弱。此前一个月,美光公司削减了高管的薪水,并暂停发放奖金。与此同时,预计今年上半年内存芯片价格将继续下跌。 美光科技的股价在2022年下跌了46%,今年迄今为止上涨了14%。CDPQ在第四季度末出售了110万股美光科技股票,持有290万股。
lg
...
金融界
2023-03-07
硅谷面临增长的终结 科技股迎来新时代!
go
lg
...
如此。芯片制造商正在削减产量。英特尔(
Intel
)最近一个季度的收入下降了32%。存储芯片生产商美光科技(Micron Technology) 11月当季销售额下降47%;第二季度的降幅将超过50%。云计算需求仍在增长,但增长速度变慢了。亚马逊和微软都表示,他们正在帮助客户“优化”他们的云支出。 与此同时,科技公司的首席执行官们加快了通过股票回购向股东返还现金的步伐。(毕竟,裁员可以释放现金。)Meta宣布了一项新的400亿美元的回购计划,使其总授权超过500亿美元,占其市值的10%以上。Salesforce几个月前刚刚公布了100亿美元的回购计划——这是它的第一个回购计划——上周将其提高到200亿美元。 拜登政府威胁要将股票回购税从1%提高到4%,但企业似乎不为所动。在任何其他年份,像Meta和Salesforce这样的公司都会很乐意用多余的现金进行收购,但美国政府也不喜欢这样。 贝尼奥夫在按下超空间按钮的同时,震惊了该公司的并购委员会,该委员会已正式解散。对于一家近年来斥资超过500亿美元收购Slack、MuleSoft、Tableau等公司的公司来说,这是一个相当大的声明。分析人士倾向于认为贝尼奥夫的扳机已经发痒,但由于有五个不同的激进投资者持有头寸,并要求他把那个“你知道什么”按钮扣紧,他必须打出面前的牌。 另一方面,考虑到拜登总统以及联邦贸易委员会(Federal Trade Commission)和司法部(Justice Department)那些鄙视并购的领导人的领导下,科技交易前景黯淡,现在退出并购相当容易。虽然美国联邦贸易委员会最终放弃了阻止Meta收购一家小型元宇宙软件公司Within的努力,但监管部门仍然对几笔悬而未决的交易感到担忧,包括微软(Microsoft)拟议收购动视暴雪(Activision Blizzard),以及亚马逊(Amazon)收购Roomba真空吸尘器制造商iRobot的交易。 更糟糕的是,IPO市场仍然关闭,因此风投支持的初创企业没有可行的退出策略。风投支持的公司在2022年第四季度筹集了324亿美元,比第三季度的总额下降了14%。风险投资公司本身也大幅放缓了对新资金的追求。安永表示,他们在2022年第四季度仅筹集了71亿美元,而今年前九个月筹集了1576亿美元。
lg
...
金融界
2023-03-07
一场压制美元的大行动!日元转向的重大拐点:日本央行“放弃超宽松”呼声高涨
go
lg
...
债券收益率的政策。Bloomberg
Intelligence
高级分析师Pri de Silva表示,日本国债的更高收益率有一天可能会吸引日本银行回归,但不太可能立即发生转变。 日本央行数据显示,甚至在黑田东彦上任之前,贷款利率就很低,截至2013年3月,新借款的平均收益率仅为0.962%。他的刺激措施进一步增加了下行压力,以至于十年后,最近的贷款利率甚至更低,为0.704%。20多年来,这些利率一直保持在2%以下。 日本三大银行的国内净利息收入在过去10年中下降了近30%,这些来自贷款和持有债券的收入一度占了他们利润的大部分。 日本银行家协会会长兼三菱日联金融集团首席执行官Junichi Hanzawa最近在一次采访中表示:“对于金融机构来说,利差下降、投资环境恶化等负面影响是事实。” 银行高管表示,一旦日本央行开始提高政策利率,他们的国内贷款业务将得到提振。即便如此,他们并不期待美联储式的快速连续加息,而是期待一种更温和、渐进的方法。SBI Securities Co.分析师Toyoki Sameshima认为,银行的利率在未来将保持不变或上升,因为它们已经降至非常低的水平。 在黑田东彦任期内的大部分时间里,日本银行股表现不佳,尤其是在央行于2016年推出负利率政策之后。银行股的表现在12月下旬得到提振,当时日本央行出人意料地调整了收益率曲线控制,市场认为这是一个先兆货币紧缩的可能开始。今年迄今为止,银行股指数已经上涨近10%,跑赢基准东证指数。 尽管如此,直田和男可能不会在成为行长后立即采取行动,因为他表示潜在的通胀需要显示出重大转变才能改变货币政策的进程。 在过去十年中,日本最大的银行加速了海外扩张。国内贷款和债券投资回报的减少促使他们在美国和亚洲寻求增长,他们经常支付可观的溢价来购买或投资其他公司。 从三菱日联金融集团收购泰国大城银行到三井住友金融集团收购印度尼西亚BTPN Tbk银行和瑞穗金融集团收购北美贷款组合等大型交易,大型银行一直在寻找机会。根据彭博汇编的数据,在过去十年中,他们至少在90笔交易中花费了超过350亿美元。 与其他发达国家的同行相比,日本银行现在拥有更多的跨境风险敞口。三大银行的海外业务现在占其总利润的40-50%,高于十年前的20-30%。在很大程度上,由于他们的海外扩张,他们的总资产增长60%以上。 预计交易将继续进行,日本迅速老龄化的人口构成了生存威胁,使得贷方不可避免地在日本以外寻求未来增长。大型银行可能会继续积极寻找海外资产。对于许多负担不起此类选择的地区性银行来说,可能会有更多整合。 美元/日元价格分析:低于136.50时看空 美元/日元空头正在发挥作用,在以下技术分析中形成一系列看跌特征后,存在下行倾向。 (来源:FXStreet) M形是一个顶部形态,考虑到趋势线的突破,偏向于下行,同时低于尾翼颈线136.50附近。 (来源:FXStreet) FXStreet分析师Ross Burland提到:“我们在4小时图上也有一个M形,虽然偏向于测试更高,但价格分组的突破可能是任何一种方式。然而在136.50以下时,偏差再次降低。” (来源:FXStreet) 至于小时图,目前正在测试趋势线下方的支撑,而135.20保持完好。我们在上方有两次失败的突破,我们可能处于市场空头的第二天,这再次导致下行偏见,同时低于136.50。
lg
...
会员
小萧
2023-03-06
人工智能:中国式ChatGPT的“大跃进”
go
lg
...
box、DeepMind、Apple、
Intel
等公司,其中有10人来自谷歌,OpenAI的首席科学家Ilya Sutskever亦是从谷歌转会而来,Ilya Sutskever是AlphaGo的作者之一,师从人工智能学界泰斗Geoffrey Hinton。 ChatGPT团队成员流动示意图 1985年出生在苏联的Ilya Sutskever,如今已经是英国皇家学会院士。据说Ilya Sutskever退出谷歌,与Sam Altman、Elon Musk等人一起创立OpenAI时,年薪曾大幅缩水。但他参与创立OpenAI的初衷是“确保强大的人工智能造福全人类”的大义和情怀。 OpenAI初创之时是一家非营利研究机构,从这点上来看,无论是否带着情怀加入这家公司的研究人员,还是给“非营利”事业烧钱的投资人,多少都有一点对技术的“信仰”,这种驱动力,可能是钱买不来的。 不过OpenAI给这些科技精英们提供的薪酬待遇并不低。据纽约时报报道,2016年,OpenAI向Ilya Sutskever支付了超过190万美元。另一位行业大佬级的研究员Ian Goodfellow(对抗式生成网络的提出者)2016年从OpenAI得到的报酬则超过80万美元,而他在这一年中只工作了9个月,不过Ian Goodfellow在OpenAI没有待很长时间就离开了。 一直以来,硅谷的AI研究员都是高收入人群。在谷歌发布的官方招聘信息中,在美国工作的全职“高级软件工程师,大型语言模型,应用机器学习”(Staff Software Engineer, Large Language Models, Applied ML)岗位基本工资范围为年薪17.4万-27.6万美元(约120万-190万元人民币)+奖金+股权+福利。 这份工作的主要职责是:为谷歌大型语言模型的关键冲刺做出贡献,将尖端的 LLM(Large Language Mode,大型语言模型) 引入下一代谷歌产品和应用程序,以及外部用户。在建模技术方面进行协作,以支持全方位的 LLM 调整,从提示工程、指令调整、基于人类反馈的强化学习 (RLHF)、参数高效调整到微调。 微软研究院的研究员岗位“博士后研究员-机器学习和强化学习”(Post Doc Researcher-Machine Learning and Reinforcement Learning)年薪则在9.4万-18.2万美元(约64万-125万元人民币)。工作职责是“与其他研究人员合作制定自己的研究议程,推动有效的基础、基础和应用研究计划。” ChatGPT团队中另一个有意思的点是团队中有9位华人成员,其中5人本科毕业于国内高校,美国学界对人才的虹吸效应也正是硅谷巨头以及“OpenAI”们强大人才竞争力的基础。 “中国的AI人才是从14亿人里挑,美国是从80亿人里挑,全世界优秀的人很多都到美国去了。”图灵联合创始人、原智源研究院副院长刘江表示,要承认差距确实存在,不过他也表示,“在这方面,我们也不用气馁。中国也有自己的优势,比如市场化、产品化的能力,近年来我们不比美国同行差了。” 国内大厂的实力如何? 除了人才问题,国内大模型研究落后美国另一个原因是在生成式AI和大模型研究方面起步略晚,而起步晚的原因,则还是与“钱”脱不开关系。 从技术角度看,生成式技术在Stable Diffusion和ChatGPT等网红产品出现之前,技术实现的效果并不理想,且需要消耗大量算力进行研究。所以大厂、资本很难斥以重资,投入到这种看上去不太赚钱,还要烧钱的业务。 中国的AI产业更注重应用场景,而非基础理论和技术创新。各家大厂在NLP的理解方面有很多成熟业务,比如听写、翻译,在视觉识别和AI大数据处理方面也有很多应用场景。所以这部分业务自然是AI研发的主力,一方面他们赚钱,另一方面在这些领域的技术积累,使研究人员能够“在规定跑道上赛跑”,而不是在未知领域探路。 这一点不只是限制了国内公司,更是很多全球巨头的创新桎梏。正如诺基亚做不出iPhone一样,巨头都不喜欢“破坏式创新”,谷歌发布的Bard只因一个小失误就牵动了母公司Alphabet的万亿市值,这也正是谷歌一直声称不愿发布LaMDA大模型的理由,害怕会因AI的失误影响自己的商誉。而OpenAI显然不太在乎ChatGPT在公测中会出什么问题,毕竟他发布ChatGPT时只是一家估值200亿美元的独角兽。 不过,在这波大模型的追赶赛中,国内大厂的团队也可以说是实力颇强。 百度在大模型方面走的最早,百度自2019年开始研发预训练模型,先后发布了知识增强文心(ERNIE)系列模型。文心大模型研发的带头人,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士,是自然语言处理领域权威国际学术组织ACL(Association for Computational Linguistics)的首位华人主席、ACL亚太分会创始主席、ACL Fellow,还是IEEE Fellow、CAAI Fellow及国际欧亚科学院院士。他还兼任中国电子学会、中国中文信息学会、中国工程师联合体副理事长等。目前,王海峰在国内外期刊会议上发表的学术论文有200余篇,获得已授权专利170余项。 虽然没有像百度一样公布类ChatGPT产品的发布时间表,但腾讯、阿里和华为分别提出的“混元”、“通义”和“盘古”三个大模型,均已研发了很长时间。 据机器学习和自然语言处理著名学者Marek Rei教授在2022年4月发布的统计(2023年的统计尚未发布)显示,2012-2021年中,在ML(Machine Learning,机器学习)和NLP顶级期刊和会议发表论文数量最多的机构是谷歌,微软紧随其后。发文数量最多的中国机构是清华大学,第二是位列第16的腾讯,腾讯也是前32名中唯一的中国互联网厂商。不过,在2021年单年的统计中,阿里和华为也登上此榜,腾讯仍排在较靠前的位置。 Marek Rei发布的2021年ML、NLP顶会、期刊发文量统计 目前,腾讯官方并没有公布“混元”大模型研发团队的具体信息。不过,腾讯旗下AI研发团队“腾讯AI Lab”的专家构成,也显示出了腾讯在AI领域的一部分实力。腾讯AI Lab由100余位AI科学家和超过300名应用工程师组成,带头人张正友博士是腾讯首席科学家、腾讯 AI Lab 及 Robotics X 实验室主任,腾讯首位17级研究员、杰出科学家。他在美国斯坦福大学(Stanford University)发布的2022 年度“全球前2%顶尖科学家榜单”(World's Top 2% Scientists 2022)中,排名全球“终身科学影响力排行榜”第1002名,中国排名 Top 10。 阿里在LLM领域的研究主要由阿里巴巴达摩院负责,阿里巴巴集团资深副总裁,阿里云智能CTO、达摩院副院长周靖人主导,他是IEEE Fellow,多次担任VLDB,SIGMOD,ICDE等国际顶级会议程序委员会主编、主席,在顶尖国际期刊和会议上发表论文超百篇,并拥有几十项技术专利。 华为也未对“类ChatGPT产品”公开表态,但在大模型方面华为亦有“盘古”大模型正在研究。该项目由华为云人工智能领域首席科学家田奇博士领导,他是计算机视觉、多媒体信息检索专家,IEEE Fellow,国际欧亚科学院院士,教育部长江讲座教授,国家自然科学基金海外杰青,中国科学院海外评审专家,在国内多所高校任讲席教授及客座教授。 在自己组建团队投入研发的同时,百度、阿里、腾讯、华为等IT大厂,也与中科院计算所自然语言处理研究组、哈尔滨工业大学自然语言处理研究所、中国人民大学高瓴人工智能学院等高校研究有很多的技术合作。 “集中力量办大事”的科研机构 数据闭环是大模型研发的关键,用户越多,积累时间越长,就意味着可以用于迭代升级的数据和反馈也就越多。 在这方面OpenAI已经利用前两代的开源GPT模型和GPT-3积累了大量数据。ChatGPT虽然才推出了3个月,但用户量和访问量增长速度飞快,这些都为OpenAI在大模型研发方面积累了巨大的先发优势。 “AI大模型如果落后了,就会面临卡脖子的风险。”很多AI专家对此都有担心,由此国内也诞生了一些应对此种局面的非营利性AI科研机构。这些机构多数有高校研究实验室背景加持,以及地方政策支持,人才聚拢能力非常强劲。 北京智源人工智能研究院(以下简称“智源研究院”)是科技部和北京市政府共同支持,联合北京人工智能领域优势单位共建的非营利性创新性研发机构。智源研究院理事长张宏江,是美国国家工程院外籍院士,ACM Fellow和IEEE Fellow,同时也是微软亚洲研究院的创始人之一。 2021年,智源研究院发布了1.7万亿参数的超大模型“悟道”的1.0和2.0版本,这项工作由100余位科学家共同打造。其中包括清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)的孙茂松教授,清华大学知识工程研究室(KEG)的唐杰教授,清华大学交互式人工智能课题组(CoAI)的黄民烈教授。 目前“悟道”大模型已经与OPPO、好未来、淘宝、搜狗、美团等开展了落地合作。在与美团的合作中,大模型给搜索广告带来了2.7%的收入增长。 在南方的科技重镇也有一家相似的研究机构,粤港澳大湾区数字经济研究院(以下简称IDEA研究院),IDEA研究院是由深圳市政府大力支持的AI研究机构。与智源研究院有一个颇有趣的相似之处,IDEA研究院的创始人沈向洋博士同样出身微软亚洲研究院。沈向洋博士是美国国家工程院外籍院士和英国皇家工程院外籍院士,他参与创建了微软亚洲研究院,担任院长兼首席科学家,并曾担任微软公司全球执行副总裁,主管微软全球研究院和人工智能产品线,并负责推动公司中长期总体技术战略及前瞻性研究与开发工作。 IDEA研究院NLP研究中心负责人张家兴博士也来自微软亚洲研究院,他的团队推出的开源模型“太乙”,据称在中文文生图领域可以达到接近Stable Diffusion(一款开源文生图AI模型)的水平。 目前IDEA研究院正在持续迭代开发的预训练模型体系“封神榜”,已经开源了6个系列共10个模型,包含4种模型结构,模型参数最大为35亿。其中包括:以Encoder结构为主的双向语言系列模型的二郎神系列;面向医疗领域,拥有35亿参数的余元系列;与追一科技联合开发的新结构大模型周文王系列;以Decoder结构为主的单向语言模型闻仲系列;以Transformer结构为主的编解码语言模型,主要解决通用任务的大模型燃灯系列;以及主要面向各种纠错任务的比干系列。 2月20日晚,复旦大学自然语言处理实验室对媒体宣传邱锡鹏教授团队发布了“国内第一个对话式大型语言模型MOSS”,并在公开平台(https://moss.fastnlp.top/),邀请公众参与内测。然而就在外界都等着看MOSS表现如何惊艳之时。MOSS的内测网站却挂出了一则道歉公告。 目前MOSS的测试网站已经挂出了停止服务的公告。一位AI大模型专家对虎嗅表示,“邱锡鹏的实验室学术研究的氛围很浓。虽然这次的MOSS很少有人得到体验机会,但是从后边的公告来看,有可能是在工程优化,并发处理等方面的准备还没有那么充分。” 在近期举行的2023年世界人工智能开发者先锋大会上,邱锡鹏教授公开表示,如果优化顺利,MOSS计划在2023年3月底开源。 虽然,没能成功抢发“国产ChatGPT”,但AI业内人士对邱锡鹏教授团队仍然给出了肯定的评价,“邱锡鹏教授的团队比较偏重学术,这和早期的OpenAI在科研心态上是有共性的,非营利性的AI研究机构,没有那么多功利的考虑。” 创业公司都有“大佬”背书 AI技术属于计算机科学,虽然计算机技术已发展多年,但AI仍属于前沿科技,对LLM以及其他通用大模型的研究更是兴起不久,仍然需要依靠应用数据,持续迭代升级,不管MOSS是不是因为工程经验绊了跟头,要在AI、大模型这些领域实现突破,能推广到市场中,接地气的技术和产品才是王道。事实上,目前国内AI行业活跃的实验室大多已开始尝试商业化,在市场的磨砺中探索大模型未来的出路。 深言科技 深言科技源自清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)。THUNLP由清华大学人工智能研究院常务副院长孙茂松,以及刘洋、刘知远,三位教授带头。实验室在2017年推出的中文诗歌自动生成系统「九歌」则是最有影响的诗歌生成系统之一,「九歌」已经为用户创作了超过3000万首诗词。 孙茂松教授领衔研发的CPM模型是智源研究院的大模型「悟道·文源」的前身,也是国内最成熟的中文生成式大模型之一。深言科技的团队也是由CPM模型的部分研发团队成员所组成的,目前该公司产品包括可以根据意思搜索词语的“WantWords反向词典”,以及根据意思查询句子的“WantQuotes据意查句”。 智谱AI 智谱AI的前身是清华大学知识工程研究室(KEG),KEG专注研究网络环境下的知识工程,在知识图谱、图神经网络和认知智能领域已发表一系列国际领先的研究成果。2006年,智谱AI就启动了科技信息分析引擎ArnetMiner(以下简称AMiner)的相关研究,先后获得了国际顶级会议SIGKDD的十年最佳论文(Test-of-Time Award)、国家科学进步奖二等奖、北京市发明专利奖一等奖。 2022年8月,由KEG与智谱AI共同研发的千亿级模型参数的大规模中英文预训练语言模型GLM-130B正式发布,其在多个公开评测榜单上超过GPT-3 v1。此外,智谱AI还打造了认知大模型平台(BigModel.ai),形成AIGC产品矩阵,提供智能API服务。 聆心智能 2月17日,聆心智能宣布完成由无限基金SEE Fund领投的Pre-A轮融资。聆心智能的底层技术是超拟人大规模语言模型,基于大模型可控、可配置、可信的核心技术优势,聆心智能推出“AI乌托邦”,该系统允许用户快速定制 AI 角色。 聆心智能由清华大学交互式人工智能课题组(CoAI)黄民烈教授支持。CoAI是清华大学朱小燕教授及黄民烈教授领导的实验室。2020年,就已经开源了1200万对话数据和中文对话预训练模型CDial-GPT。黄民烈教授也曾参与了智源研究院的“悟道”大模型研发。 西湖心辰 西湖心辰背靠西湖大学深度学习实验室,创始人是西湖大学助理教授、博士生导师蓝振忠,主要研究大规模预训练模型的训练与应用。蓝振忠曾在谷歌担任研究科学家,也是轻量化大模型ALBERT的第一作者。 西湖大学在人工智能领域的研发实力很强,除了蓝振忠博士的深度学习实验室,西湖大学NLP实验室,在该领域的研究也非常领先。学术带头人张岳博士在Marek Rei教授的顶会、期刊发文量统计中,于2012-2021年期间排名全球第四。 “目前国内LLM领域的创业公司相对IT大厂来说主要有两个优势,技术和数据。”西湖心辰COO俞佳对虎嗅表示,国内大模型创业公司在技术方面普遍已有多年研究经验,构筑了一定的技术壁垒,这是很难短期超越的。同时,由于已经推出了相关产品,“数据飞轮”已经转起来了,这些数据的质量相比互联网数据质量要高很多,能够对产品迭代起到很大支撑作用。 对于国内大模型创业公司未来的发展趋势,俞佳认为可能性很多,“有些公司可能会走出自己的道路,也有的公司可能会像OpenAI一样与IT大厂开展深度合作,甚至像DeepMind直接并入其中。” 出品|虎嗅科技组 作者|齐健 编辑|陈伊凡 来源:DeFi之道 来源:金色财经
lg
...
金色财经
2023-03-05
英国最高法院激辩:机器人能算发明者吗?
go
lg
...
会导致一种特殊的情况。英国知识产权局(
Intellectual
Property Office)拒绝对此置评。 这起案件源于2018年,在他的专利申请被拒后,塞勒将英国知识产权局诉至法院,法院判定塞勒败诉,因为根据英国1977 年颁布的专利法,发明人必须为“自然人”。 后来,塞勒又向伦敦法院提起上诉,但2021年,上诉法院再次裁定人工智能系统不能作为发明人。
lg
...
金融界
2023-03-03
中国式ChatGPT“大跃进”
go
lg
...
box、DeepMind、Apple、
Intel
等公司,其中有10人来自谷歌,OpenAI的首席科学家Ilya Sutskever亦是从谷歌转会而来,Ilya Sutskever是AlphaGo的作者之一,师从人工智能学界泰斗Geoffrey Hinton。 ChatGPT团队成员流动示意图 1985年出生在苏联的Ilya Sutskever,如今已经是英国皇家学会院士。据说Ilya Sutskever退出谷歌,与Sam Altman、Elon Musk等人一起创立OpenAI时,年薪曾大幅缩水。但他参与创立OpenAI的初衷是“确保强大的人工智能造福全人类”的大义和情怀。 OpenAI初创之时是一家非营利研究机构,从这点上来看,无论是否带着情怀加入这家公司的研究人员,还是给“非营利”事业烧钱的投资人,多少都有一点对技术的“信仰”,这种驱动力,可能是钱买不来的。 不过OpenAI给这些科技精英们提供的薪酬待遇并不低。据纽约时报报道,2016年,OpenAI向Ilya Sutskever支付了超过190万美元。另一位行业大佬级的研究员Ian Goodfellow(对抗式生成网络的提出者)2016年从OpenAI得到的报酬则超过80万美元,而他在这一年中只工作了9个月,不过Ian Goodfellow在OpenAI没有待很长时间就离开了。 一直以来,硅谷的AI研究员都是高收入人群。在谷歌发布的官方招聘信息中,在美国工作的全职“高级软件工程师,大型语言模型,应用机器学习”(Staff Software Engineer, Large Language Models, Applied ML)岗位基本工资范围为年薪17.4万-27.6万美元(约120万-190万元人民币)+奖金+股权+福利。 这份工作的主要职责是:为谷歌大型语言模型的关键冲刺做出贡献,将尖端的 LLM(Large Language Mode,大型语言模型) 引入下一代谷歌产品和应用程序,以及外部用户。在建模技术方面进行协作,以支持全方位的 LLM 调整,从提示工程、指令调整、基于人类反馈的强化学习 (RLHF)、参数高效调整到微调。 微软研究院的研究员岗位“博士后研究员-机器学习和强化学习”(Post Doc Researcher-Machine Learning and Reinforcement Learning)年薪则在9.4万-18.2万美元(约64万-125万元人民币)。工作职责是“与其他研究人员合作制定自己的研究议程,推动有效的基础、基础和应用研究计划。” ChatGPT团队中另一个有意思的点是团队中有9位华人成员,其中5人本科毕业于国内高校,美国学界对人才的虹吸效应也正是硅谷巨头以及“OpenAI”们强大人才竞争力的基础。 “中国的AI人才是从14亿人里挑,美国是从80亿人里挑,全世界优秀的人很多都到美国去了。”图灵联合创始人、原智源研究院副院长刘江表示,要承认差距确实存在,不过他也表示,“在这方面,我们也不用气馁。中国也有自己的优势,比如市场化、产品化的能力,近年来我们不比美国同行差了。” 国内大厂的实力如何? 除了人才问题,国内大模型研究落后美国另一个原因是在生成式AI和大模型研究方面起步略晚,而起步晚的原因,则还是与“钱”脱不开关系。 从技术角度看,生成式技术在Stable Diffusion和ChatGPT等网红产品出现之前,技术实现的效果并不理想,且需要消耗大量算力进行研究。所以大厂、资本很难斥以重资,投入到这种看上去不太赚钱,还要烧钱的业务。 中国的AI产业更注重应用场景,而非基础理论和技术创新。各家大厂在NLP的理解方面有很多成熟业务,比如听写、翻译,在视觉识别和AI大数据处理方面也有很多应用场景。所以这部分业务自然是AI研发的主力,一方面他们赚钱,另一方面在这些领域的技术积累,使研究人员能够“在规定跑道上赛跑”,而不是在未知领域探路。 这一点不只是限制了国内公司,更是很多全球巨头的创新桎梏。正如诺基亚做不出iPhone一样,巨头都不喜欢“破坏式创新”,谷歌发布的Bard只因一个小失误就牵动了母公司Alphabet的万亿市值,这也正是谷歌一直声称不愿发布LaMDA大模型的理由,害怕会因AI的失误影响自己的商誉。而OpenAI显然不太在乎ChatGPT在公测中会出什么问题,毕竟他发布ChatGPT时只是一家估值200亿美元的独角兽。 不过,在这波大模型的追赶赛中,国内大厂的团队也可以说是实力颇强。 百度在大模型方面走的最早,百度自2019年开始研发预训练模型,先后发布了知识增强文心(ERNIE)系列模型。文心大模型研发的带头人,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士,是自然语言处理领域权威国际学术组织ACL(Association for Computational Linguistics)的首位华人主席、ACL亚太分会创始主席、ACL Fellow,还是IEEE Fellow、CAAI Fellow及国际欧亚科学院院士。他还兼任中国电子学会、中国中文信息学会、中国工程师联合体副理事长等。目前,王海峰在国内外期刊会议上发表的学术论文有200余篇,获得已授权专利170余项。 虽然没有像百度一样公布类ChatGPT产品的发布时间表,但腾讯、阿里和华为分别提出的“混元”、“通义”和“盘古”三个大模型,均已研发了很长时间。 据机器学习和自然语言处理著名学者Marek Rei教授在2022年4月发布的统计(2023年的统计尚未发布)显示,2012-2021年中,在ML(Machine Learning,机器学习)和NLP顶级期刊和会议发表论文数量最多的机构是谷歌,微软紧随其后。发文数量最多的中国机构是清华大学,第二是位列第16的腾讯,腾讯也是前32名中唯一的中国互联网厂商。不过,在2021年单年的统计中,阿里和华为也登上此榜,腾讯仍排在较靠前的位置。 Marek Rei发布的2021年ML、NLP顶会、期刊发文量统计 目前,腾讯官方并没有公布“混元”大模型研发团队的具体信息。不过,腾讯旗下AI研发团队“腾讯AI Lab”的专家构成,也显示出了腾讯在AI领域的一部分实力。腾讯AI Lab由100余位AI科学家和超过300名应用工程师组成,带头人张正友博士是腾讯首席科学家、腾讯 AI Lab 及 Robotics X 实验室主任,腾讯首位17级研究员、杰出科学家。他在美国斯坦福大学(Stanford University)发布的2022 年度“全球前2%顶尖科学家榜单”(World's Top 2% Scientists 2022)中,排名全球“终身科学影响力排行榜”第1002名,中国排名 Top 10。 阿里在LLM领域的研究主要由阿里巴巴达摩院负责,阿里巴巴集团资深副总裁,阿里云智能CTO、达摩院副院长周靖人主导,他是IEEE Fellow,多次担任VLDB,SIGMOD,ICDE等国际顶级会议程序委员会主编、主席,在顶尖国际期刊和会议上发表论文超百篇,并拥有几十项技术专利。 华为也未对“类ChatGPT产品”公开表态,但在大模型方面华为亦有“盘古”大模型正在研究。该项目由华为云人工智能领域首席科学家田奇博士领导,他是计算机视觉、多媒体信息检索专家,IEEE Fellow,国际欧亚科学院院士,教育部长江讲座教授,国家自然科学基金海外杰青,中国科学院海外评审专家,在国内多所高校任讲席教授及客座教授。 在自己组建团队投入研发的同时,百度、阿里、腾讯、华为等IT大厂,也与中科院计算所自然语言处理研究组、哈尔滨工业大学自然语言处理研究所、中国人民大学高瓴人工智能学院等高校研究有很多的技术合作。 “集中力量办大事”的科研机构 数据闭环是大模型研发的关键,用户越多,积累时间越长,就意味着可以用于迭代升级的数据和反馈也就越多。 在这方面OpenAI已经利用前两代的开源GPT模型和GPT-3积累了大量数据。ChatGPT虽然才推出了3个月,但用户量和访问量增长速度飞快,这些都为OpenAI在大模型研发方面积累了巨大的先发优势。 “AI大模型如果落后了,就会面临卡脖子的风险。”很多AI专家对此都有担心,由此国内也诞生了一些应对此种局面的非营利性AI科研机构。这些机构多数有高校研究实验室背景加持,以及地方政策支持,人才聚拢能力非常强劲。 北京智源人工智能研究院(以下简称“智源研究院”)是科技部和北京市政府共同支持,联合北京人工智能领域优势单位共建的非营利性创新性研发机构。智源研究院理事长张宏江,是美国国家工程院外籍院士,ACM Fellow和IEEE Fellow,同时也是微软亚洲研究院的创始人之一。 2021年,智源研究院发布了1.7万亿参数的超大模型“悟道”的1.0和2.0版本,这项工作由100余位科学家共同打造。其中包括清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)的孙茂松教授,清华大学知识工程研究室(KEG)的唐杰教授,清华大学交互式人工智能课题组(CoAI)的黄民烈教授。 目前“悟道”大模型已经与OPPO、好未来、淘宝、搜狗、美团等开展了落地合作。在与美团的合作中,大模型给搜索广告带来了2.7%的收入增长。 在南方的科技重镇也有一家相似的研究机构,粤港澳大湾区数字经济研究院(以下简称IDEA研究院),IDEA研究院是由深圳市政府大力支持的AI研究机构。与智源研究院有一个颇有趣的相似之处,IDEA研究院的创始人沈向洋博士同样出身微软亚洲研究院。沈向洋博士是美国国家工程院外籍院士和英国皇家工程院外籍院士,他参与创建了微软亚洲研究院,担任院长兼首席科学家,并曾担任微软公司全球执行副总裁,主管微软全球研究院和人工智能产品线,并负责推动公司中长期总体技术战略及前瞻性研究与开发工作。 IDEA研究院NLP研究中心负责人张家兴博士也来自微软亚洲研究院,他的团队推出的开源模型“太乙”,据称在中文文生图领域可以达到接近Stable Diffusion(一款开源文生图AI模型)的水平。 目前IDEA研究院正在持续迭代开发的预训练模型体系“封神榜”,已经开源了6个系列共10个模型,包含4种模型结构,模型参数最大为35亿。其中包括:以Encoder结构为主的双向语言系列模型的二郎神系列;面向医疗领域,拥有35亿参数的余元系列;与追一科技联合开发的新结构大模型周文王系列;以Decoder结构为主的单向语言模型闻仲系列;以Transformer结构为主的编解码语言模型,主要解决通用任务的大模型燃灯系列;以及主要面向各种纠错任务的比干系列。 2月20日晚,复旦大学自然语言处理实验室对媒体宣传邱锡鹏教授团队发布了“国内第一个对话式大型语言模型MOSS”,并在公开平台(https://moss.fastnlp.top/),邀请公众参与内测。然而就在外界都等着看MOSS表现如何惊艳之时。MOSS的内测网站却挂出了一则道歉公告。 目前MOSS的测试网站已经挂出了停止服务的公告。一位AI大模型专家对虎嗅表示,“邱锡鹏的实验室学术研究的氛围很浓。虽然这次的MOSS很少有人得到体验机会,但是从后边的公告来看,有可能是在工程优化,并发处理等方面的准备还没有那么充分。” 在近期举行的2023年世界人工智能开发者先锋大会上,邱锡鹏教授公开表示,如果优化顺利,MOSS计划在2023年3月底开源。 虽然,没能成功抢发“国产ChatGPT”,但AI业内人士对邱锡鹏教授团队仍然给出了肯定的评价,“邱锡鹏教授的团队比较偏重学术,这和早期的OpenAI在科研心态上是有共性的,非营利性的AI研究机构,没有那么多功利的考虑。” 创业公司都有“大佬”背书 AI技术属于计算机科学,虽然计算机技术已发展多年,但AI仍属于前沿科技,对LLM以及其他通用大模型的研究更是兴起不久,仍然需要依靠应用数据,持续迭代升级,不管MOSS是不是因为工程经验绊了跟头,要在AI、大模型这些领域实现突破,能推广到市场中,接地气的技术和产品才是王道。事实上,目前国内AI行业活跃的实验室大多已开始尝试商业化,在市场的磨砺中探索大模型未来的出路。 深言科技 深言科技源自清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)。THUNLP由清华大学人工智能研究院常务副院长孙茂松,以及刘洋、刘知远,三位教授带头。实验室在2017年推出的中文诗歌自动生成系统「九歌」则是最有影响的诗歌生成系统之一,「九歌」已经为用户创作了超过3000万首诗词。 孙茂松教授领衔研发的CPM模型是智源研究院的大模型「悟道·文源」的前身,也是国内最成熟的中文生成式大模型之一。深言科技的团队也是由CPM模型的部分研发团队成员所组成的,目前该公司产品包括可以根据意思搜索词语的“WantWords反向词典”,以及根据意思查询句子的“WantQuotes据意查句”。 智谱AI 智谱AI的前身是清华大学知识工程研究室(KEG),KEG专注研究网络环境下的知识工程,在知识图谱、图神经网络和认知智能领域已发表一系列国际领先的研究成果。2006年,智谱AI就启动了科技信息分析引擎ArnetMiner(以下简称AMiner)的相关研究,先后获得了国际顶级会议SIGKDD的十年最佳论文(Test-of-Time Award)、国家科学进步奖二等奖、北京市发明专利奖一等奖。 2022年8月,由KEG与智谱AI共同研发的千亿级模型参数的大规模中英文预训练语言模型GLM-130B正式发布,其在多个公开评测榜单上超过GPT-3 v1。此外,智谱AI还打造了认知大模型平台(BigModel.ai),形成AIGC产品矩阵,提供智能API服务。 聆心智能 2月17日,聆心智能宣布完成由无限基金SEE Fund领投的Pre-A轮融资。聆心智能的底层技术是超拟人大规模语言模型,基于大模型可控、可配置、可信的核心技术优势,聆心智能推出“AI乌托邦”,该系统允许用户快速定制 AI 角色。 聆心智能由清华大学交互式人工智能课题组(CoAI)黄民烈教授支持。CoAI是清华大学朱小燕教授及黄民烈教授领导的实验室。2020年,就已经开源了1200万对话数据和中文对话预训练模型CDial-GPT。黄民烈教授也曾参与了智源研究院的“悟道”大模型研发。 西湖心辰 西湖心辰背靠西湖大学深度学习实验室,创始人是西湖大学助理教授、博士生导师蓝振忠,主要研究大规模预训练模型的训练与应用。蓝振忠曾在谷歌担任研究科学家,也是轻量化大模型ALBERT的第一作者。 西湖大学在人工智能领域的研发实力很强,除了蓝振忠博士的深度学习实验室,西湖大学NLP实验室,在该领域的研究也非常领先。学术带头人张岳博士在Marek Rei教授的顶会、期刊发文量统计中,于2012-2021年期间排名全球第四。 “目前国内LLM领域的创业公司相对IT大厂来说主要有两个优势,技术和数据。”西湖心辰COO俞佳对虎嗅表示,国内大模型创业公司在技术方面普遍已有多年研究经验,构筑了一定的技术壁垒,这是很难短期超越的。同时,由于已经推出了相关产品,“数据飞轮”已经转起来了,这些数据的质量相比互联网数据质量要高很多,能够对产品迭代起到很大支撑作用。 对于国内大模型创业公司未来的发展趋势,俞佳认为可能性很多,“有些公司可能会走出自己的道路,也有的公司可能会像OpenAI一样与IT大厂开展深度合作,甚至像DeepMind直接并入其中。” 来源:金色财经
lg
...
金色财经
2023-03-03
上一页
1
•••
215
216
217
218
219
•••
242
下一页
24小时热点
更多细节来了!中美日内瓦经贸会谈联合声明出炉,港股暴拉黄金急跌
lg
...
特朗普会不会又变卦?!中美达成关税协议后,中国官媒积极、但社交平台质疑声高涨
lg
...
中美报复性关税几乎都取消了!全球彻底疯狂:美股暴涨、黄金崩跌、人民币直线拉升
lg
...
中美下调关税115%:全面贸易战或已避免!黄金暴跌超100美元 分析师点评来了
lg
...
中美关税重磅消息引发黄金新一轮暴跌!金价崩跌近80美元 黄金最新交易分析
lg
...
最新话题
更多
#Web3项目情报站#
lg
...
6讨论
#SFFE2030--FX168“可持续发展金融企业”评选#
lg
...
32讨论
#链上风云#
lg
...
97讨论
#VIP会员尊享#
lg
...
1951讨论
#CES 2025国际消费电子展#
lg
...
21讨论