划著名滑鼠,把达文西系统的核心技术拆开来一条一条细细研究。
等把所有检索到的资料看过一遍之后,肖宿歪了一下头。
有意思。
他虽然不懂所谓的工艺,但拋去所有不知所云的设计,直面本质,电机的运转精度,剥掉那层工程外皮,內核不就是一个多变量动態系统的控制优化问题吗
关节的运动轨跡、受力平衡、误差补偿,每一项都可以写成连续可微的几何函数。
而恰好,他之前研究出的加权度量和流形优化理论,核心就是在一个高维几何空间里,给定一堆约束条件,找出一条最优路径。
它要解决的就是这样的难题。
也就是说,只要学懂了他之前的理论,那么完全可以解决达文西的电机精度问题。
用一个他更熟悉的说法,伺服电机的控制问题本质上是在一个非交换李群上求解测地线方程。
这条测地线对应著电机从当前位置到目標位置的最优运动轨跡,而关节的摩擦、惯性、回差,不过是在测地线上加了几组扰动项而已。
甚至都不需要怎么思考,只需要计算就可以了。
他拿出笔和纸把需要的定理和方法写了下来,越写,他发现熟悉的东西越多。
扰动项的处理方法其实也已经有解决办法了。
他在《粘性流体中和乐的演化方程与耗散结构》那篇论文里写得很详细,把耗散源拆成频带分量,逐一带宽约束,系统稳定性就能守住。
肖宿蹙著眉又在草稿纸的空白处多加了几行字。
继续往下看,他发现力反馈的信號处理问题其实也不是很难。
他之前在tois发的那篇《基於李群理论的图分割框架》,核心思路是把一个大规模网络分割成若干子图,让子图之间的连接儘量稀疏、子图內部的连接儘量紧密。
当时用到的数学工具是李群表示论,就是通过群作用约束分割边界,保证拓扑结构的稳定性。
这个思路只要稍微转一个弯,完全就可以用到这里来。
毕竟力反馈本质上也是一个动態信號在闭环迴路里的实时解算问题。
传感器的採样信號是一堆高频数据,里面有医生的主动操作,有手部的生理震颤,还有机械本身的噪声。
要把这三样东西在毫秒之內分离开,过滤掉震颤和噪声,只把真正的力反馈信號传给医生。
这不就是个信號的特徵解耦问题吗
他在saci上发的那七篇自监督学习论文,做的就是特徵解耦。
用群论框架把纠缠在一起的特徵表示一层一层剥开,每个特徵对应一个独立的群表示,互不干扰。
平移过来的话,力反馈信號也可以被模型分解成几个独立的频带分量:
低於一赫兹的是医生的操作意图,八到十二赫兹是生理震颤,更高频的是机械噪声。
用一个基於小波变换的频带滤波器把这三个分量拆开,医生的操作信號走一条快速通道,震颤和噪声各走各的滤波通道,最终合成回来的时候,延迟就被压缩到了採样周期的量级。
肖宿一旦思考起来,脑子就活跃的不得了。
夏日的夜晚寂静安逸,整个房间里,就只剩下笔尖落在纸上的沙沙声,清晰又急促。
他写字一直很快,不过十分钟,纸面上已经写满了计算方程和相关的定理,墨跡还未完全乾透,他就毫不犹豫地抽过下一张,埋头继续写。
待思绪落到第三项核心技术的时候,肖宿手上的笔停了一下。
这项技术的数学內核,怎么看怎么熟悉。他仔细一想,发现竟然和自己证明哥德巴赫猜想时用到的方法很相似。
当时,他为了让分层筛法与鞍点圆法的融合,就通过把二维的素数分布信息,“ lift ”到更高维的流形上去处理,从而构造了一个新的几何工具。
而达文西的成像方式也是另一种形式的升维。
它是通过把两个微型摄像头伸进人体,將拍摄的二维画面实时合成,然后放大十倍,就变成的医生能够看到的三维立体影像。
这种多视图几何重建,说白了就是把多个二维投影还原成三维空间结构。
这件事的数学基础是辛几何,因为光学成像系统的哈密顿量天然具有辛结构,两个摄像头之间的视差关係可以用一个辛矩阵来描述。
而辛几何。
现在全世界最完整的辛几何统一框架,是他写的。
只要把光学系统的辛矩阵往他构建的顾辛流型里一套,投影关係自动就解出来了,而且可以绕开直觉外科那套算法里好几个冗余的计算步骤,重建速度会更快,画面精度会更高。
他看著屏幕上的內容,放下笔,沉默了几秒。
这三项核心技术,每一项拆开来,底层全是他已经解决的东西,几何优化、群论解耦、辛几何重建,这些东西在他的论文里已经被翻来覆去地用了不知道多少遍。
肖宿皱了皱眉,怎么也没发现这个东西的难度在哪儿。
可他分明记得刚才看的材料里写著,全世界能造出这种精度手术机器人的公司,只有直觉外科一家。
从二零零零年到现在,整整二十六年过去了,德国的西门子、日本的奥林巴斯、华国的几家企业,投了不知道多少钱,全卡在这三个地方过不去。
这就很奇怪了。
突然,许铭拿著框架上门的场景又出现在了眼前,也许,那些研究员和许铭差不多呢
肖宿摇了摇头,已经放弃去思考他们为什么不会了。
他把手稿收好,打算明天让高长安去打听一下。
如果实在没有,那就自己造好了。
指挥小智把所有的资料全部整理归档之后,肖宿躺在床上,慢慢沉入了彻底的黑暗中。