新浪财经讯 8月29日,由中国证券投资基金业协会金融科技专业委员会联合易方达基金、华夏基金、阿里云、通联数据等举办,新浪财经独家媒体支持的“FDDC2018全球金融数据探索与发现大赛答辩会”在北京金融街威斯汀大酒举行。本次大赛有两大赛题,分别为“A股上市公司营业收入预测”与“A股上市公司公告信息抽取”。
在投资研究过程中,上市公司公告是投资者的重要参考材料,挖掘公告中的重要信息是研究员每日的必要功课。但是,海量公告信息让人脑难以负荷,如果机器能够根据需求,自动分析、过滤、抽取有价值的结构化数据,就能帮助研究员快速获取投资线索,从而做出最及时、准确的决策。
在信息抽取赛题答辩中,复赛排名第一名的“GOGOGO”战队表示,抽取模型的关键是关系建立,包括主键组合,即同一个句子中的实体组合主键;同性关联主键,即主键与属性出现在同一个句子的组合;条件规则过滤,即关键词匹配句子过滤;去重等。评委表示,该团队作品中,对html的结构运用处理理念和效果较好。
据了解,“GOGOGO”战队为黄泽炽1人组成的团队,黄泽炽毕业于湖南师范大学,生物化学与分子生物学专业。