科大两教授因搜寻器和数据库研究获奖
由香港科技大学研究人员撰写的两篇论文,最近勇夺「第十四届数据库系统高级应用国际研讨会」(研讨会)中叁项最佳论文奖的其中两项。研讨会於四月底在澳洲布里斯本举行。
首篇获奖论文由科大计算机科学及工程学系教授李迪麟及其当时的研究生Budi Yuwono撰写,与搜寻器的管理与发展有关。论文获大会「十年来数据库高级应用最佳论文奖2009」。主办单位从过去十年(1989-1999)於研讨会上发表的论文,挑选出最优秀的作品。在过去十年,该研讨会共举行了六次,并收集了320篇论文,李教授的文章能够排眾而出,实在难能可贵。
奖项的评审委员会对李教授的论文给予高度评价,认為该论文「是有关综合搜寻器最早期的论文之一。文章影响了现今网站伺服器及信息检索的研究主题,亦对伺服器排名方法的发展作出贡献。」评审委员会经过长达十多年的观察,仔细评核论文对其研究领域所產生的影响,才得出这个结论。论文自1997年发表后共获120次的论文引述。
其实,早於搜索器仍在发展雏型的1994年,李教授经已开展这项研究。当时「谷歌」搜寻器仍未出现,而市场上只有叁家全文检索引擎,包括WebCrawler、InfoSeek及Lycos。即使在这个相对「浑沌」的阶段,李教授在论文中所铺陈的见解经已极具前瞻性,新颖独到而经得起时间的考验,特别是文章中有关必须提防「一器独大」的论述,再对照现时网络搜寻器市场由数大搜寻器瓜分的局面,实在发人深省。
「依赖一家庞大网络搜寻器作网页搜索工作会引发不少问题,包括侵犯私隐、严重限制数据筛选、更新及个人化等等。」李教授表示。
李教授期望这种营运方式,必须由不同族群的搜寻器取代。这些不同族群的搜寻器由一批共同协作的较小型搜寻器组成。「这种运作模式,将可有效解决侵犯私隐的问题,搜寻器的经营者或网页内容持有人将可以随时随地追踪用家的瀏览状况,在搜寻器中增加或删减内容。」
科大计算机科学及工程学系助理教授陈雷(左)及其博士生连翔获「数据库高级应用最佳论文奖2009」。
大会的第二项最佳论文奖,由科大计算机科学及工程学系助理教授陈雷及其博士生连翔获得,其论文研究如何在不精确的数据中(如大概的收入或年龄,如$10,000-19,999或10-19岁)进行概率排名查询。
陈教授表示,他们的研究主旨「是把主体的数据(如某一新生婴儿的健康状况)与其他数据持有者(如其他新生婴儿的健康状况等)作出比较,从而得出主体在有关数据库中的排位。这种查探程序有极大的应用价值―譬如是找出某婴孩身高体重在数据库所有婴孩中的排名;或把信用咭申请人与数据库中其他信用咭持有人的财务状况作出比较,从而釐定该申请人的信贷限额等。」
李迪麟教授
李教授现為科大计算机科学及工程学系教授。他在94年加入科大前,曾為美国俄亥俄卅立大学计算机及资讯科学系副教授。他毕业於加拿大多伦多大学,获计算机科学硕士及博士学位。李教授现正从事另一项纲络搜寻器研究,目的是依据用家瀏览网页的爱好及习惯,把搜索结果个人化。
陈雷教授
陈教授於2005年加入科大,现為科大计算机科学及工程学系助理教授。他於加拿大滑铁卢大学取得博士学位。陈教授的研究重点包括非精确及概率数据库、多媒体数据库、图表数据库及网络数据库等。