即使没有完整数据也能仅筛选“有意义的群体”
有望用于客户分析、异常交易检测和新药开发
韩国国内研究团队开发出一项分析技术,能够在复杂的网络数据中,仅高效地找出与特定对象强关联的群体。预计可用于小规模高粘性客户群分析、可疑诈骗账户追踪、基于蛋白质网络的新药开发等领域。
蔚山科学技术院(UNIST)28日表示,计算机工程系 Kim Junghoon 教授研究团队开发出一种新的社区分析算法,在用户指定的目标节点必须被包含的前提下,只在预先设定的规模内搜索具有实际意义的群体。
基于真实关系网络数据的社区搜索性能对比。研究团队的算法在空手道社团、海豚社会关系网等真实网络数据中,以高于既有方法的准确度识别出真实群体。此外,在亚马逊、YouTube 等大规模关系网络中,也能有效发现内部连接紧密、与外部清晰区分的群体。下方示例是以目标用户为中心进行搜索得到的社区结果,蓝色节点越多、红色节点越少,表示群体识别准确度越高。研究团队供图
View original image社区搜索是一种在大规模网络数据中,找出内部连接紧密群体的技术,被用于社交媒体推荐系统、金融异常交易检测、生物学网络分析等领域。既有技术往往需要掌握整个网络信息,在存在个人信息限制或超大规模数据环境中,难以应用;同时还存在将关联较弱对象一并归入同一群体的问题。
研究团队开发出一种方法,即便无需完整掌握整个网络,也能在用户指定目标周边,仅筛选出“真正有意义的群体”。
该算法从特定节点出发,逐一搜索周边候选节点并扩展群体。在此过程中,算法会计算新增候选节点后整体连通性提升的程度,并通过设计,使得当群体规模不必要地变大时,得分不会轻易上升。
此外,算法并非只看单个关系,而是同时分析周边的小型连接子结构,从而将那些单独看并不显眼、但共同出现时能强化群体特性的关系一并反映在结果中。
“诈骗检测·小众客户分析”……贴近现实的人工智能分析技术
在真实网络数据实验中,也验证了性能提升效果。根据研究团队的说明,与现有最高性能方法相比,F1 分数最高提升至 1.39 倍,ARI 分数最高提升至 5.95 倍。这意味着在更准确筛选出目标群体的同时,较少纳入关联较弱的对象。
研究团队预计,这项技术在实际产业环境中的应用潜力很高。例如,在营销领域可精确提取小规模忠诚客户群,在金融领域可用于发现与可疑诈骗账户相连接的相关群体;在生物学领域,则可通过蛋白质关系网络分析,为新药开发寻找线索。
Kim Junghoon 教授表示:“在现实中的网络分析,很难一次性获取全部数据,而且所需群体的规模大多是预先限定的。本次技术的重点,是能在用户关注对象周边,快速找出具有意义的关系。”他还表示:“该技术有望应用于推荐服务、异常交易检测、蛋白质网络分析等多个领域。”
本次研究由 UNIST 研究员 Kim Dahee 作为第一作者参与,并在韩国研究财团的资助下完成。研究成果已被数据库领域最高权威学术会议之一“2026 国际数据管理学会(SIGMOD)”录用,计划对外发布。
版权所有 © 阿视亚经济 (www.asiae.co.kr)。 未经许可不得转载。