千千文学网

千千文学网>换个姿势我们 > 第1811章 哥你什么时候来的(第2页)

第1811章 哥你什么时候来的(第2页)

两人走进盖茨计算机科学中心时刚好八点十五分。电梯里贴着几张海报:下个月将在西雅图召开的CVPR会议征稿通知,卡内基梅隆与英特尔合作研究项目的招聘启事,还有一张,瑞迪教授不知道又获得什么奖项的新闻剪报。

项目组会议室在五楼东侧。两人推开门时,里面已经坐了三四个人。

长条会议桌一端,瑞迪教授正低头翻阅着一沓打印稿,鼻梁上架着那副标志性的半框眼镜。这位图灵奖得主今天穿了件浅蓝色的牛津纺衬衫,袖子挽到手肘,露出小臂上浓密的汗毛。

“曹,你的报告在第三个,”瑞迪头也不抬地说,“我希望看到完整的误差分析,而不仅仅是准确率数字。”

“明白,教授。”

曹鹏坐到最边上,从包里取出笔记本电脑和一份打印好的资料。他习惯纸质备份,在这个PDF和PowerPoint已经普及的年代,这显得有些老派,但他喜欢在汇报时用铅笔快速标注重点的感觉。

组会准时开始。第一个汇报的是博士三年级生艾米丽·陈,一个除了姓氏,其他各方面已经和华裔都不沾边的女生,包括长相,毕竟,作为第一批来到丑国的华工后代,你要相信基因的力量。

她做的是基于主动轮廓模型的医学图像分割。汇报到一半时,瑞迪打断了她。

“你的能量函数中正则项系数是固定的?”

“是的,目前是0。3。”

“试过自适应调整吗?根据图像局部梯度?”

艾米丽愣了一下,“这……会增加计算复杂度。”

“先验证有效性,再优化效率。”瑞迪的语气平和,却带着不容置疑的权威,“下周三之前,给我三组对比数据。”

曹鹏低头在自己的笔记本上快速记下一行字,“正则项自适应,可用于多尺度特征权重分配?”他的思维总是这样,即使在听别人的汇报,也会下意识寻找与自己课题的交叉点。

第二个汇报的就是胖子维杰。

他提出了一种基于互信息的特征选择方法,用于降低高维特征空间中的冗余。

汇报过程中,曹鹏三次举手提问,一次关于互信息估计中核函数带宽的选择依据,一次关于该方法在类别不平衡数据集上的鲁棒性,还有一次关于计算复杂度的实际评估。

每次提问都朝着要害而去。维杰的回答起初还游刃有余,到第三个问题时,额头已渗出细密的汗珠。

“计算复杂度方面,”维杰翻动着幻灯片,试图找到相应的分析页面,“理论上是O(n2),但实际实现中我们采用了近似算法……”

“近似算法的误差界是多少?”曹鹏追问。

会议室安静了几秒。瑞迪抬起头,目光在两人之间扫过,嘴角似乎微微上扬了一毫米—,这是他对学生间高质量辩论的认可。

“这……我们还在分析。”维杰最终承认。

“那么在你的实验结果中,至少应该标注‘使用近似算法’的说明。”曹鹏的语气没有得意,只是陈述事实,“否则对比是不公平的。”

维杰点头坐下时,曹鹏对他眨了眨眼,这是两人之间的默契,辩论归辩论,不影响午饭时一起吐槽系里新出台的服务器使用规定。

瑞迪教授朝曹鹏点头,“上周我们讨论了SIFT特征在动态场景中的漂移问题。曹鹏提出了一个新框架的初步想法。今天,请他详细展开。”

曹鹏起身,在靠近白板的位置坐下,他没用投影,有些思路,手写更能体现思考的脉络。

“谢谢教授。”他转向小组,目光扫过每个人的脸。

维杰抱着手臂,眉头微皱,艾米丽已打开笔记本,二年级博士生汤姆眼神放空,大概还没从昨晚的Dota战中回神,而博士后捷尔任斯基,则冲曹鹏眨眨眼。

“我们现有的图像分类流程:特征提取、编码、池化、分类器。”曹鹏画了四个方框,“问题在于,手工设计的特征,比如SIFT。。。。在类别增多、视角变化剧烈时,区分度下降。而编码阶段用的K-means或稀疏编码,本质是假设特征服从单一分布。”

说到这儿,他等等,看是否有人提问。维杰动了动嘴唇,但最终选择放弃。

“我的提议是,放弃手工特征,直接从像素学起。”曹鹏在“特征提取”框上打了个叉,“但不是用传统的全连接神经网络,参数量太大,且忽略图像的空间局部性。我设计了一个多尺度稀疏自编码器结构。”

本小章还未完,请点击下一页继续阅读后面精彩内容!

他又在白板上画出三层结构,第一层是小感受野的卷积核,提取边缘纹理,第二层卷积核变大,整合局部结构,第三层是全连接层,但施加L1稀疏约束。每一层都用无监督预训练初始化,再用反向传播微调。

“关键在这里,”曹鹏在第三层旁写下公式,“我们不在像素空间做稀疏,而是在特征空间做。将每张图的特征激活视为一个信号,用字典学习找到过完备基,然后求解稀疏系数。”

“这样,分类问题转化为,在字典空间中找到最具判别力的稀疏模式。”

说着,写下一串数学符号。然后转向实际问题,“我在Caltech101数据集上试了初步版本。64×64的图,三层结构,第一层用6×6卷积核,步长2,得到16个特征图;第二层……”

“等等。”维杰终于举手,语气带着质疑,“曹,你算过时间复杂度吗?光是第一层卷积,假设输入是64×64的RGB图,6×6核,步长2,输出16个特征图,一次前向传播就需要多少乘加操作?这还没算上稀疏编码的迭代优化。你的模型能在合理时间内完成训练吗?”

已完结热门小说推荐

最新标签