正文第939章 CUDA决赛（4）|重生一年，家里资产破亿|重生一年，家里资产破亿章节阅读-零点小说网

亲,双击屏幕即可自动滚动

正文第939章 CUDA决赛（4）

    “我看了你的技术白皮书，去年我们也有几个基于CUDA的量化交易系统，其中有一个团队的项目被我们直接纳入了课程表体系”

    张明对着选手团开口道。

    他是还是今年团体赛的评委。

    “但我印象没出错的话，他们的承压的交易笔数是45万笔/秒，而我看了你们的白皮书，最高理论值是120万笔/秒，落地则是30万笔/秒，这里面有什么不一样？”

    郝建设听完评委老师的提问，略微组织了一下语言，开口回道。

    “白皮书上所说的理论峰值是指上千个CUDA线程并行解析不同行情字段，即TesK40的共享内存加上全局内存合并访问优化下，单条行情解析延迟10μs，按流水线并行算，每秒能处理1/10e-6×15个SM×多调度≈120万笔/秒”

    “但实际落地跟理论峰值的区别在于实际落地要处理丢包重传、数据校验、行情时间戳对齐，还要预留30%的性能余量避免波动”

    “所以实际稳定承压30万笔/秒，这个数据完全可以覆盖现在的申鹏交易所的峰值行情，甚至还有10倍以上的冗余”

    说到这，他还解释了一遍今年申鹏交易所的交易数据。

    “当前申鹏交易所的Level-2行情（逐笔成交＋十档买卖盘），全天约5000万笔数据，盘中峰值（比如股指期货开盘/收盘前）约2-3万笔/秒”

    “我们的交易系统在承压这块，完全足够”

    “OK”

    张明点了点头，随即又问道。

    “我注意到你们这个项目主要是风险对冲，请问你们是如何实现这项功能的？”

    这个问题就轮到了金洋作答了，是他负责CUDA低延迟优化。

    “关于对冲逻辑我们是这么设计的”

    说着他便开始演示具体的模拟对冲，阐述也随着演示开始讲解。

    “我们先把把上千个合约的实时行情、持仓数据、保证金参数全部存入GPU显存，每个CUDA线程负责一个合约的盈亏计算、一个风险因子的VaR计算，并行遍历所有持仓”

    “全账户的风险指标更新延迟从CPU的300s，压缩到12μs”

    “行情每跳动一次，风险指标就同步更新一次，一旦触发预警，立刻自动平仓对冲，彻底避免穿仓”

    “就是你们用CUDA把行情解析加快了，同时又把订单撮合加速了，接着又通过风险对冲将决策执行发布了出去”

    张明沉默了数秒，将脑海中的画面用通俗的词汇描绘了一番。

    “可以这么理解吗？”

    “完全问题，您总结的就是我们所要表达出来的意思”

    金洋连忙点头道。

    “OK，我没有什么问题了”

    张明在笔记本上记录了一些信息，随即提问权来到了杨静这边。

    “说说商业落地场景吧”

    这是一道送分题。

    李晶晶在听到商业提问的问题后，连忙起身笑着回道。

    “从去年开始，国内量化私募就迎来了爆发，仅申城就有上百家新设机构，所以我对我们的项目推广非常有信心，因为高频交易的核心竞争力就是延迟，每降低1μs就能带来数百万的超额收益，这点我相信会有不少私募机构会非常感兴趣的”

    “对此，我们分别作了短期、中期以及长期的目标规划”

    “说说看”

    杨静开口笑道。

    “短期内，我们会申请软着与发明专利，和合作私募完成试点部署，根据实盘反馈优化系统稳定性，推出标准化单机授权版本，按套收取授权费，主要面向的中小量化私募”

    “中期1到2年内，和国内券商经纪部门合作，作为券商极速交易系统的配套加速模块，按交易量分润，同时拓展期货、期权市场，覆盖全品类高频交易场景”

    “至于长期，这是我们的目标，我们想打造国内首个基于GPU的量化交易平台，提供策略开发、回测、实盘全流程服务，从软件授权转向平台化年费模式，巩固行业龙头地位”

    “野心不小，但我很看好你们”

    “谢谢老师”

    李晶晶对着评委们鞠躬致谢。

    随着提问的结束，现场工作人员开始验证第一支小组的实际性能，确认系统是否真能稳定触及30万笔/秒的行情处理能力，以及是否可以实现风险对冲功能。

    就在第一个项目还在实际验证阶段，第二支团队开始登场。

    这是京城示范大学团队提交上来的项目，《基于CUDA的大规模在线教育实时课堂音视频互动与虚拟板书系统》。

    “各位评委老师好，我是京城示范大学的廖智敏”

    “我是秦晴”

    “我是周琦”

    “我是王姿然”

    “我们今天带来的项目是《基于CUDA的大规模在线教育实时课堂音视频互动与虚拟板书系统》，这是一款从音视频采集到课堂互动输出的全流程CUDA闭环系统”

    负责CUDA优化的秦晴开口介绍道。

    李科翻了翻项目白皮书，确认这个项目的方向跟课程表即将推出的在线课堂有些许的关联后，笑着开口问道。

    “我看到你们提交上来的白皮书有说，你们这套系统可以实现音视频编解码、回声消除、虚拟板书渲染以及多人互动的端到端低延迟处理，同时还支持100人以上班级的实时互动，端到端延迟低于80s？说说你们的技术逻辑”

    “针对多人课堂的回声消除、噪声抑制、混音处理，我们设计了CUDA并行化的自适应滤波算法”

    秦晴连忙看向提问评委，开口回道。

    “每个CUDA线程负责一路音频流的处理，可以将100路音频的混音与回声消除耗时从CPU的25s压缩到0.5s，端到端音频延迟低于50s，这样就可以满足实时课堂互动的需求”

    “那针对传统虚拟板书书写延迟高、笔迹卡顿的这些痛点你们又是通过什么办法进行消除的？”

    李科继续问道。

    “我们设计了基于CUDA的笔迹实时平滑渲染算法，把笔迹的贝塞尔曲线拟合、抗锯齿渲染全流程CUDA并行化，书写延迟从CPU的200s降到30s以内，和在黑板上书写的体验完全一致，并且我们的系统可以同时支持多人书写、课件标注以及屏幕共享”

    秦晴继续回答道。

    对于自己团队设计出来的这个系统，他们是非常有信心拿到好成绩的。

    毕竟，对症下药嘛！！！

    课程表的基本盘在高校，而他们的教育系统更是完美地贴合了课程表的智能教室项目。

    当前，智能教室只支持上课视频回放，而他们也是从这个回放功能中找到了灵感。

    作为师范生，他们学校对于教育这块非常重视，所以这套课程回放功能出现后，立即就引起了不少有心人的注意。

    既然上课视频可以回放？

    那可不可以将课程直接搬上线上呢？

    答案是可以的。

    特别是随着4G网络的商用，更是加快了这种情况的进程。

    但现在的在线视频教学几乎都集中在高价值的1对1教学，很少有大班课，特别是一些头部的培训机构，主要原因就是成本太高。

    而他们这套教育系统通过CUDA并行解决了这个痛点，虽然实际落地肯定需要大量资金，但他们的目的又不是自己创业？

    只是想用这个项目敲开课程表的大门而已。

    毕竟这种需要大笔资金推广的项目，单靠他们几个人是没办法推广出去，即便拿到了投资，业务推广、公司运营这些才是衡量一家公司能否存活的关键。

    他们是有自知之明的。