公司新闻

与Niankong Technology Wang Xiao的对话:定量覆盖资金的

作者: bet356在线官方网站   点击次数:    发布时间: 2025-05-24 13:08

资料来源:36KR的定量行业在AI中重新出现,Niankong首次在国际会议上提供了最低级别的研究。定量背景 +大型模型=?六个月前,当他面对这个算术问题时,大多数人回答了DeepSeek,但是随着研究工作的出版,出现了新的答案。 5月15日,定量资本Niankong Technology与上海Jiaotong大学科学技术学院合作,发送了一项出色的模型研究工作,讨论了“自适应混合培训方法”。这个故事导致了对尼安孔技术已经“进入自己的业务”的伟大模型的理论的研究,而不是私人资本对大型模型的定量投资如何获得丰富的收益率,这使其成为第一个Quantitati InstitationChina攻击NIP。在Niankong之前,DePseek是唯一对定量孵化的研究的公司E资本,基于大规模模型的理论研究和已发表研究的结果。与“ Senius”相比,Niancon更进一步。基于DepSeek,Niankong提出了一种新的,最佳的培训方法,以提高培训效率。这是定量行业中大型真实模型的少数创新研究之一。从技术的角度来看,DePseek提出了强化学习的重要性。 Niankong技术总裁Wang Xiao及其团队发现,与DeepSeek的实践相比,交替的SFT和RL可以在一段时间内进行密集的SFT(有监督的精细调整),并执行密集的RL(参考人员学习参考)。定量行业一直称为IA孵化器。 Niankong的技术创新使AI可以为定量行业提供更好的评​​论。王小说:“在过去的AI经历中祖数据,财务数据具有少量的信号 /噪声关系。肖在清晨意识到大型模型可以帮助预测财务数据。大型模型可以带来tart数据本身和具有InterModal理解功能的信息。 “上海尼安孔与乔顿大学计算机科学学院之间的合作也非常重要,不仅在技术创新方面,而且对于工业,学术界和研究的结合而言。学术界存在相对缺乏计算机力量和工程学经验的问题,而且具有人才,理论研究和范围的项目的优势,而且在范围内涉及项目的优势,而专业的项目则是范围内的项目,并在范围内进行了范围的项目。为了促进申请的实施,封闭式制造业的两个获胜结果通常确定未来的行业,并与T紧密相关他的学术界,这使他们有机会成为成为学术机会的机会。扩展但可以在不同的领域和行业中实施和繁荣的“学术“种子”,改变了普通人在定量行业中的生活的各个方面,从来没有成熟地应用成熟的应用,以成熟应用成熟的应用,以成熟应用生产,教育和研究成熟的成熟应用,以实现成熟的成熟应用。部门,他们必须了解最大模型的基础层如何工作。我注意到该领域训练的中心框架基本一致。因此,将垂直场的训练框转移到另一个方面很容易。一个间接的行动表明,妮可(Niancon)具有更大的“野心”:妮可技术(Niancon Technology)还孵化并确定已经建立的一切(所有频率思维)。未来的主要工作将要研究基本算法和大型模型工程技术,同时更多地关注垂直应用,包括财务场景。定量可以用于大型模型,可用的能量可能远远超出了想象力。随着对市场应用方面的关注,Niankong可以从财务AI开始,并通过推广大量应用程序来向前迈进。只有重组全球的竞争全景,才能释放中国伟大的模型行业的可能性并利用活力。公司和大学的结合还允许中国具有基本的大型模型能力。一个重要的原因是中国行业积累的数据和语料库是独特的好处。对于少数的头衔,对基本研究的持续投资需要技术促进的长期投资,而不是明确的投资回报率。 Niankon的长期在该领域加深农作物的坚实选择足以反映其战略愿景。自2019年以来,Niankong Technology已将反式算法应用于其真实的Time产品组合,并且这种完整的连锁智能大大提高了战略发展的效率。从全球的角度来看,随着大型模型的竞争加剧,积累了与人工智能算法的长期经验的定量行业是对职位的需求。同时,国际定量巨头正在大型模型的探索,实验和支持阶段。 Iankong的选择是适应市场的变化,并提前准备“曲线前进”。 IA技术可以有多少可能有助于定量投资? Niancoon在探索大型模型中的潜力如何?考虑到这些问题,36KR与Niankong Technology的创始人Wang Xiao进行了交谈。以下是一个详细的c面试的反复。 Niancon制作了一个很棒的模特:准备斗争36KR:作为全球报道基金,Niancon是如何推出自己的AI通行证的?为什么这些文档出现在大型模型领域? Wang Xiao:在2017年,我们创建了一个由三人组成的团队,使用自动学习算法测试财务数据。第一个项目是关于期货的,但是期货数据的数量特别小。当自动学习算法适用于很少有数据的样品时,它们很容易过度。结果。在2018年,当应用于股票时,这是非常好的,因为股票的行动量远大于未来数据。在2019年,90%的实际在线光盘模型成为神经网络的算法,即变形金刚。 2021年,我们的公司达到100亿日元。这是因为整个过程正确适用于自动和神经元网络学习算法。 2023是另一个节点。当Openai出来时,我意识到大型型号可以HelP预测财务数据。这是因为大型模型可以带来超出次要数据的信息,并具有模式的理解功能。过去,通过将这些算法应用于AI,大多数监督培训都是调整历史数据,但是最大模型的主要逻辑是不同的,因此它可以是可以预测金融市场趋势的另一种模型。今年DeepSeek的出现不仅引起了智力平等,而且还揭示了强化学习的重要性。以前最大的模型集中在训练之前监控的设置上。我们始终确定了大型模型,并积累了相当大的算法和计算机功率,因此今年我们已经对本文档(Great Models)进行了基本的理论研究。它在这里。 36KR:Niankong正在进行的研究似乎非常前卫。与DepSeek不同的“自适应混合训练方法”是什么?王夏O:从DeepSeek培训方法中,我们可以看到该方法可以集中精力在一段时间内学习练习问题(SFT),专注于参加考试一段时间,并考虑和总结测试结果(RL)。我们受到人类学习方法的经验的启发,学习高频写作问题和考试经验观点之间的变化可以进一步提高学业成绩(推理能力)。然后,我们设计了一种舞台训练方法,以在SFT和RL之间进行更改。在下一步之前,我们根据我们设计的自适应算法决定是否使用SFT或RL进行下一步。最后,在我们的实验中,我们发现,对于三个不同的公共数据集,新提出的培训框架明显优于SFT SOT,RL Solo,SFT和RL简单混合,并表明新提出的框架是一种更好的训练方法。 36kr:我意识到该文档正在与信息学院合作上海豪尔赫大学的ICS和技术。 Wang Xiao:如果您正在使用大型型号进行垂直培训,则必须首先包含LTO出色模型培训的所有培训细节。这也是制作此文档的起点。我们与大学合作的原因是,学者和行业在重要模型的研究中具有自己的优势和缺点。工业和教育的结合可以在学习自己的优势和劣势中发挥作用。这确实改善了国家人工智能基础研究。 36KR:本文档的结果实际上非常罕见和有价值。这是因为许多人工智能公司已经从对大型基础模型的调查中退休。 Wang Xiao:是的,但是值得关注的是,停止它?像Tongyi Qianwen 3一样,参数仅是DeepSeek的三分之一,但它们的功能超过了DeepSeek。很少有具有更强大特征的不同类型的模型正在增加,每个人都会增加hing是开源。未来多数公司的最大竞争力是如何很好地使用这些出色的模型并更好地训练它们。大型模型就像是一个具有很高智力系数的一般天才,但是即使这样一个人没有正确的方式教他如何投资和量化的正确方法,他也无法“从零框架开始”。所有这些的基础是首先了解大型模型的基本原理。理解伟大模型的基本原理的最佳方法是开始直接练习,而不是阅读一千个文档。 36KR:在本文档的协作过程中,Niankon大学和Joton在上海的“补充”角色中的“互补”角色是吗? Wang Xiao:该大学具有科学的研究能力,但其资源和计算机能源不足。例如,许多大学没有足够的计算机能力来实施大型学习Ining Iscreek。此外,缺乏数据。尽管在工程和计算机能源方面的经验越来越多,但论文可能没有形成学术经验。双方都可以发挥自己的优势,避免自己的劣势,并为双方提供有利的结果。 36KR:Niankong目前是否有重要的自我开发模型?还是您使用开源第三? Wang Xiao:有一个垂直的自我开发模型,它符合Tongyi Qianwen 3。进行理论研究时,我们基本上使用Qianwen模型来训练和实验。从财务开始,不仅是AI36KR Financiero:现在Niankong团队的规模吗? Wang Xiao:整个团队都有大约数十名AI工程师。 70%至80%的人受大学本身的培训,只有少数人被社会采用。 36KR:在学校中从头开始选择培训似乎是Thermalinos行业的普遍特征,以招募主要的模型工程师。这相当于促进从学校开始的定量行业的应用功能。快速:是的,我们的内部平台完全由我们的IT团队编写,因此它是为创建该模型的基本特征或使用高度标准化和集成的框架做事。因此,如果另一方有能力,它完全熟悉我们公司的研究工具,因此经过六个月的实习,它可以成为我们公司的家庭学生。 36KR:Niankong还创立了一家独立的公司Allmind(完整的乐队思维)。公司内部团队的劳动部是什么?为什么我需要单独创建? Wang Xiao:Allmind和Niankong团队的AI团队在您的工作内容中都有重要的工作部门。 Niankong团队的主要任务是使用自动学习和深度学习算法适应财务数据。场景相对垂直,主要是责任用于技术研究和针对特定问题的模型优化。 AllMind的主要任务与大型模型有关,例如大型模型培训算法和研究技术的优化,高质量的COT数据生产地址的学术探索,包括大型大型模型的研究工作以及财务场景的垂直应用。我们希望在AI的基础研究中取得进步,在包括财务在内的更多领域散发出来,并为商业提供更多的可能性和想象力。因此,Short是私人资本和租赁公司的定量基金。他们没有打算获得短期利润,并且两家公司的工作都是完全不同的,因此所有公司都分别设立了。 36KR:这不仅限于财务场景中的其他垂直应用研究,但是您如何从Iankong计划开始呢? Wang Xiao:AllMind在算法中具有一定的经验和认知积累S和工程技术涉及大型模型,因此使用大型模型的SFT和RL财务数据培训后的经验表明,所有垂直领域中培训任务的中心框架基本一致。例如,每个字段都需要高质量和COT数据。在进行补充学习之前,要求SFT首先获得对模型中特定领域的基本了解。两者都需要正确有效的奖励模型。在短期内,基于财务数据以及解决当前大型模型的问题(例如提高大型模型的逻辑推理能力,减少了大型模型的幻觉问题,并研究大型模型是否可以独立创新),将重点关注大型特殊模型的培训。将来,我们将与学者和行业合作,尝试在新材料,研究和制药开发等领域应用大型模型和AI的参与者。 36KR:Niankong Big Model的金融技术取得了成果。您是否会考虑将来为公众开始全面的财务应用吗?毕竟,这是一个很棒的市场,我们看不到任何特别好的产品。王小:我们当然正在从事相对垂直的项目。这可以由常规投资者使用,并帮助中小型投资者提供好的报价。 REESWILL传统的定量历史磨砂膏? 36KR:定量贸易模型是否与AI模型有关?他们如何关系? Wang Xiao:您所做的事情可以预测未来。预测未来的前提是总结过去的经验。例如,在过去五年中,市场规定的规则是什么?随后,通过应用这些规则赚钱是量化的基本逻辑。如何总结过去?有两种方法:一个是线性模型,另一个是使用AI Algor的非线性模型ITHMS。添加所有影响系数,并在没有调整工具的情况下执行线性添加。这是一个普通的多因素系统。另一种方法是通过自动学习和深度学习算法来训练过去五年的基本数据和某些特征,并总结模型中过去五年的规则。这是一种非线性模型。传统定量公司使用的AI技术通常反映在最低的AI算法级别,这些算法经过调整并总结了最后的历史。当前,除了直接调整机器的完整时间算法外,还可以直接使用大型模型进行预测。我认为这是一种可能的方法。 36KR:如何评估定量模型的质量?因素数量很重要吗? Wang Xiao:SO称为定量或定量预测模型分为两种类型。由逻辑驱动。只有两个因素,但是如果这两个因素是逻辑Al因素,即使只有两个,它实际上也可能有用。但是,如果这两个因素基于统计数据,例如学习采矿机,调整一些数据,在历史上计算它们等。就数量而言,更好。与2,000个因素相比,10个因素肯定还不够。但是,与2,000个因素相比,20,000个因素肯定更好?噪声也会增加。 36KR:大型模型中的幻觉问题会影响定量过程吗? Wang Xiao:称为IC的定量行业具有指标。 IC是正确答案与其预测的响应之间的相关性。如果完全正确,则IC为100%。实际上,例如,用于选择库存的α模型ICS只能从15%到20%。换句话说,预测不是很精确。这些不准确的部分也可以被视为幻想,但是定量贸易不需要100%的增益率。即使您的胜利率是ONLY 49%,您仍然可以赚钱。关键是在模型和开发失败的模型后很长一段时间被及时消除。 36kr:那么,当您真正使用AI时,不需要改善性能吗? Wang Xiao:使用AI,不仅一定会提高性能,而且还会导致非常差的性能。它可能非常适合培训数据。我认为它具有非常聪明的模型,但是如果将它们应用于将来的数据之后,它完全不好,这是完全不好的,可能会损失很多钱。 36KR:定量模型似乎仍然很高,甚至传统的互联网制造商也很少进入该领域。 Wang Xiao:这个问题是Internet上使用的AI与金融中使用的AI之间的最大区别。我们招募了许多Internet AI工程师,并要求他们使用AI算法来获取AI模型来预测股票收益率,但我们发现10名工程师中至少有8名将失败。 DAT的数量互联网上的一个非常大,非常稳定。在行业内部,使用AI技术可能“容易”,但财务数据并不完全相同。财务数据非常小,非常不稳定,信号 /噪声比非常低。例如,在过去五年中了解了市场环境之后,他发现了规则。经过连续三天的行动,它在第四天继续增加。也许上升市场是这样的,但它可能在未来三年内成为一个裸露的市场。该规则失败。因此,在互联网行业中,训练大型语言模型的困难是如何解决算法和工程问题,因为有必要将尽可能多的GPU和服务器连接起来进行高效且大规模训练。在金融行业,它连接GPU没有问题。实际上,服务器足以培训。但是,您不能很好地训练。因为如果适合的话对于规则纠正,如果未重复或完全反对未来的市场,可能会损失资金。因此,伟大的财务模型的困难是如何找到过分弯腰和小拐角处之间的平衡。