北京信息科技大学-智能信息处理研究所
Institute of Intelligent Information Processing, Beijing Information Science & Technology University

学术动态

当前位置:首页  学术动态 
  • 研究所的研究方向主要包括自然语言处理、网络内容安全、大数据处理与分析、智能仓储与物流、人工智能与知识工程等。

    (1)自然语言处理研究方面

    对汉语词义消歧与标注、词义标注语料库的建设方法进行了比较深入的研究。在语言知识资源的可计算性分析及加工转换处理、词义消歧知识的提取与模式化方法、汉语词义消歧与标注的语言模型与算法、词义标注语料库的一致性检验技术等方面取得了一些成果。主持了国家自然科学基金项目“汉语词义标注语料库的自动构建及一致性检验技术研究(60873013)”、北京市自然科学基金B类重点项目“汉语词汇语义的可计算性及其消歧方法研究(KZ200811232019)”、中国博士后科学基金项目“面向汉语词义消歧与标注的语言模型研究(2005038026)”以及其他相关项目。开发了“综合语言知识库系统”、“汉语词义自动标注研究实验平台”、“汉语词义标注一致性检验系统”等一些程序软件。

    对中文文本错误的自动侦测与纠错方法进行了比较深入的研究。在基于大规模语料知识资源的句法和语义搭配知识提取、表示以及知识库构建方法方面,在字词错误、句法错误和语义错误侦测算法和纠错建议的生成与排序算法方面都取得了一些成果。主持了国家自然科学基金项目“基于语义分析的汉语文本错误自动侦测与纠错方法(61070119)”,在科学出版社出版了专著《统计语言建模与中文文本自动校对技术》,开发的“正文通”中文文本校对系统已经走向产业、实用化,并应用于外交部公文处理系统、北京拓尔思信息技术股份有限公司的网络文本校对系统、北京溯源鸿业科技有限公司等多个单位的实际项目中,取得了较好的经济效益和社会效益。

    对中文微博的信息挖掘方法进行了比较深入的研究。在微博语料采集及加工处理、微博文本信息的语义分析、微博文本可信度评价、情感倾向性计算以及个性化信息搜索方法等方面取得了一些成果。主持了国家自然科学基金项目“基于语义分析的中文微博信息挖掘方法研究(61370139)”。本次申报的项目是对信息内容安全类事件的侦测分析及传播机理、演化态势进行研究,研究深度更深,且涉及多种数据源的社交媒体。所以,已有微博研究为本次申请的项目奠定了较好的基础。

    对汉语新闻文本的指代消解方法进行了深入研究。目前正在承担的国家自然科学基金青年基金项目“基于语义的汉语新闻文本的零形回指消解研究(61602044)”。主要研究面向零形回指消解的词汇语义计算模型、基于汉语新闻文本的短语/句子语义模式库的构建。这些研究为本次申请的项目提供了自然语言处理的基础技术。

    (2)在大数据内容理解与处理技术方面

    对大数据内容的理解技术及其智能化处理技术进行了深入研究。主持了北京市属高等学校创新团队建设提升计划项目“大数据内容理解的理论基础及智能化处理技术(IDHT20130519)”,参与了创新团队项目“面向数字内容的知识表达与智能化处理(PHR201007131)”。对大数据处理中的基础数据表达、处理、存储以及分布式并行计算处理方法进行了研究,并对包括深度学习算法在内的多种机器学习方法进行了比较深入的研究,这都为本项目的研究奠定了基础。

    (3)Web信息内容安全及大数据处理技术方面

    近年来,项目组在网络信息安全领域开展了比较深入的研究,对网络访问相关的各种日志数据的分析和挖掘技术进行了深入的研究。该研究采用Kafka高吞吐量的发布订阅消息系统,实时处理消费者规模的动作流数据(网页浏览等用户的行动),并存储于Hadoop分布式计算架构上的Hive数据仓库中。计算引擎采用类似于MapReduce的通用并行框架Spark,能够将中间输出结果保存在内存中,不需要读写HDFS,能更好地适用于数据挖掘与机器学习等需要迭代的算法。最终将处理结果存储于可移植性好、可靠性高的Oracle关系数据库管理系统中,便于展示与查询等应用。上述技术已应用于项目组主持并承担的3项国家242信息安全计划项目, 这些项目都属于信息内容安全相关的研究领域,通过这些项目的研发,为我们在信息内容安全领域与大数据处理技术领域积累了一些经验,也为本次申请的项目研究奠定了基础。

    (4)智能物流与仓储方面

        自研究所成立以来,就与山西东杰智能物流装备股份有限公司校企合作研发智能仓储与物流方面的相关产品。针对智能化立体仓库系统中的仓库管理系统WMS、仓库控制系统WCS以及物流设备中的关键技术问题开展研究。在WMS软件方面,提出了面向多目标优化的货位动态分配综合算法,建立了面向立体仓库出入库过程中货物动态变化情况下的货位分配模型;在WCS方面,提出了直线开端轨道多辆往复式RGV穿梭车避撞、防追尾智能调度方法;在自动化物流设备方面,采用新技术和新材料对堆垛机和穿梭车等设备进行设计和制造,所设计的穿梭车输送装置采用伸缩结构,实现了输送机的无缝对接,使不同宽度托盘支腿都能平稳过渡。取得了包括发明专利、软件著作权、学术论文在内的多项知识产权。先后在秦皇岛港务局、中国人民解放军沈阳军区某部、北京以岭药业有限公司、北京恒通创新赛木科技股份有限公司、国药集团深圳坪山基地、山西杏花村汾酒厂股份有限公司、南京华赛福保安器材有限公司等单位进行了产业化应用,建造了相当数量的智能化立体仓库,应用单位均取得了巨大经济效益。


  • 1. 网络社交媒体中特定社会安全事件的侦测分析与态势评估研究(编号:61772081), 国家自然科学基金面上项目,2018.01—2021.12

    2. 特定*****知识库(编号:2017****), 国家242信息安全计划专项,2017.4—2018.4

    3. 基于语义分析的中文微博信息挖掘方法研究(编号:61370139)), 国家自然科学基金面上项目, 2014.01—2017.12

    4. 面向*****知识库(编号:2016****), 国家242信息安全计划专项, 2016.04—2017.03

    5. 信安*****知识库(编号:2015****), 国家242信息安全计划专项, 2015.04—2016.03

    6. 大数据内容理解的理论基础及智能化处理技术(编号:IDHT20130519), 北京市属高校学术创新团队提升计划项目, 2015.01—2015.12

    7. 基于语义的汉语新闻文本的零型回指消解研究(编号:61602044),国家自然科学基金青年项目,2017.01-2019.12

    8. 北京市专业群共建, 北京航空航天大学, 2015.11—2016.10

    9. 北京建筑大学图书馆智能研讨室系统平台开发, 北京慧通顺恒技术服务有限公司, 2017.11—2018.11

    10. 基于语义分析的大规模汉语文本错误自动侦测与纠错软件开发, 北京拓尔思信息技术有限公司, 2016.12—2018.12

    11. 中文文本校对API组件及领域知识库开发, 北京数据堂科技有限公司, 2015.5—2016.12

    12. 中文文本校对与纠错组件研制开发, 北京溯源鸿业科技有限公司, 2014.12—2015.12

    13. 深圳国药一致药业立体仓库WMS管理系统开发, 山西东杰智能物流装备股份有限公司, 2014.8—2016.12

    14. 中文文本语义错误自动侦测组件模块开发, 南京热信软件科技有限公司, 2016.12—2018.12

    15. 深度分词与词性标注,北京数据堂科技有限公司,2016.5-2018.6

    16. 基于知网的话题句识别研究,北京市教委科技发展计划面上项目,2014.1-2017.12

    17. 结合抽样与聚合方法的流式大数据分析模型研究(编号:KM201711232014),北京市教委科研计划项目,2017/01-2018/12。

    18. 面向"互联网+餐饮"的推荐系统关键技术研究,北京市教育委员会科技计划一般项目,2017.1-2018.12

     

  • 近三年发表的代表性论文

    [1] Study of Sentiment Classification for Chinese Microblog Based on Recurrent Neural Network,Chinese Journal of Electronics, 2016.7, Vol.25(4):601~607 (SCI:000379796700002

    [2] Multi-feature-Based Subjective Sentence Classification Method for Chinese Micro-blogsChinese Journal of Electronics, 2017.11, Vol.26(6):1111-1117 SCI:000415662500001

    [3] 中文文本语义错误侦测方法研究,计算机学报, 2017.4, Vol.40(4):911-924EI:20172703889291

    [4] 基于多特征融合的微博用户权威度定量评价方法电子学报, 2017.11, Vol.45(11):2800-2809 EI:20180304655060

    [5] 一种基于语义关系图的词语语义相关度计算模型,自动化学报, 2018.1, Vol.44(1):87-98

     EI20181705042011

    [6] 基于双重注意力模型的微博情感分析方法清华大学学报(自然科学版), 2018.2Vol.58(2):122-130 EI源期刊)

    [7] 一种级联式微博情感分类器的构建方法,中文信息学报, 2017.9, Vol.31(5):178-184 (中文核心期刊)

    [8] HDP-TUB Based Topic Mining Method for Chinese Micro-blogsLecture Notes in Artificial Intelligence, 2018.1, Vol.10619:856-865. EI20180504695168 

    [9] 基于定长序列的双向LSTM分词优化方法,郑州大学学报(理学版), 2018.2, Vol.50(2):97-101 (中文核心期刊)

    [10] 智能化仓储中箱式缓存区调度算法的设计与应用,现代电子技术, 2017.8, Vol.40(16): 86-89+93 (中文核心期刊)

    [11] 一种基于社区发现的微博个性化推荐算法,微电子学与计算机, 2017.6, Vol.34(6):40-44 (中文核心期刊)

    [12] 微博文本的句向量表示及相似度计算方法研究,计算机工程, 2017.5, Vol.43(5):143-148 (中文核心期刊)

    [13] 基于关联关系的微博用户可信度分析方法,计算机应用, 2017.3Vol.37(3):654659 (中文核心期刊)

    [14] 微博文本聚类中特征扩展策略研究,计算机工程与应用, 2017, 53(3):90-94 (中文核心期刊)

    [15] 一种面向文本分类的特征向量优化方法,计算机应用研究, 2017.8, Vol.34(8)2299-2302+2348 (中文核心期刊)

    [16] 一种网络日志属性挖掘与分析方法,计算机应用研究, 2017.5, Vol.34(5)1410-1414 (中文核心期刊)

    [17] Chinese Text Proofreading Model of Integration of Error Detection and Error CorrectionLecture Notes in Computer Science, 2016.11, Vol.10085:376-386.(EI: 20165203193040)

    [18] 统计与规则相融合的领域术语抽取算法,计算机应用研究, 2016.8, 33(8): 2282-2285+2306 (中文核心期刊)

    [19] 一种基于聚集系数的社区发现算法,计算机工程与科学, 2016.2, Vol.38(2):363-369 (中文核心期刊)

    [20] 新闻专题阶段性摘要的生成研究,计算机应用研究, 2016.4, Vol. 33(4):973-978+996 (中文核心期刊)

    [21] 基于多特征融合的中文微博评价对象抽取方法,计算机应用研究, 2016.2, Vol.33(2):378-383(中文核心期刊)

    [22] 多设备集成的智能化仓库管理系统的设计与应用,制造业自动化, 2015.11, Vol.37(11):143-149 (中文核心期刊)

    [23] Word Similarity Computation Based on HowNet12th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD2015) EI:20162002385763, ISTP: 000380521700262

    [24] Cross-language Sentiment Classification Based on Support Vector Machine11th International Conference on Natural Computation (ICNC2015) EI:20161102105237, ISTP: 000380617000085 

    [25] A Method of Constructing on Micro-Blog Content Credibility ModelInternational Journal of Knowledge and Language Processing, 2015.8, Vol.6(3):1-10

    [26] 基于词内部结合度和边界自由度的新词发现,计算机应用研究, 2015.8, Vol.32(8)2302-2304+2342,(中文核心期刊)

          专著与教材

           在科学出版社、高等教育出版社、电子工业出版社等出版专著与教材14部,包括:

    [1] 张仰森,统计语言建模与中文文本自动校对技术,科学出版社, 2017.3, ISBN 978-7-03-051855-2 

    [2] 张仰森、黄改娟,人工智能教程(第2),高等教育出版社,2016.9,“十一五”国家级规划教材,北京市精品教材,ISBN 978-7-04-046166-4

    [3] 张仰森、黄改娟,人工智能教程,高等教育出版社,“十一五”国家级规划教材,北京市精品教材,2008.3

    [4] 张仰森,人工智能教程学习指导与习题解析,高等教育出版社,2009.4

    [5] 张仰森,人工智能原理与应用,高等教育出版社,2004.2

    [6] 张仰森,人工智能原理复习与考试指导(第二版),高等教育出版社,2004.3

       专利与软件著作权:

    获批发明专利3项,实用新型专利1软件著作权26项。

    [1] 一种领域术语抽取方法,国家知识产权局,2017.02,专利号:ZL201410047277X

    [2] 一种面向用户查询意图的汉语句子相似度分层计算方法及装置,国家知识产权局, 2017.03,专利号:ZL201410341855.0

    [3] 存储式压力采集系统及其油井压力采集方法,国家知识产权局,2013.1.23授权、ZL200910307879.3

    [4] 可组网的火灾报警系统,国家知识产权局,2009.7.29授权,中国,ZL200820302426.2

    [5] 智能化立体仓库计算机监控与调度系统V1.0 [简称WCS系统],软件著作权登记号:2008SR18693.

    [6] 智能化立体仓库手持终端软件系统V1.0 [简称RFS系统],软件著作权登记号:2008SR18694.

    [7] 基于B/S结构的智能化立体仓库WMS软件系统V1.0[简称RFS系统],软件著作权登记号:2009SR05691.