大象传媒

テクノロジー?材料

复数の机関が保有するデータをより安全に统合解析する础滨技术を开発

研究イメージ画像 (Image by ART STOCK CREATIVE/Shutterstock)

 础滨による解析の精度を上げるためには分布の偏りのない十分な数のデータを集めることが重要です。このとき、复数の机関に分散したデータを集めるためには、个人情报やノウハウなどの秘匿したい情报に配虑して安全に统合解析する础滨技术が必要となります。特に个人情报を含む场合、共有するデータと元データに「容易照合性」があるとその利用において制约があることが课题でした。


 本研究では、复数の公司?自治体?病院等がそれぞれ保有する个人情报データに対して、个人を特定可能なデータと容易照合できない抽象化データのみを共有し统合的に解析する、より安全な人工知能技术「容易照合不可データコラボレーション技术」を开発しました。この研究では、データ间の容易照合性に対する数学的定义を导入し、検讨する枠组みを导入しました。その上で、元データと容易に照合できない抽象化データのみ共有する统合解析アルゴリズムを提案しました。これにより、个人情报を含むデータ解析においてより多くのデータを活用することが可能となり、础滨の解析精度の大幅な向上が実现されると考えられます。


 具体的な応用例として、复数の医疗机関が有する検査?投薬データの统合解析による疾患予测や疾病リスク因子推定や、复数の教育机関の学生データの统合解析による教育効果増进などが挙げられます。また、将来的にはさまざまな机関にある质の高い个人情报データを、元データを保护したまま収集して础滨による分析を行う新たなプラットフォームを支える技术としても期待できます。


笔顿贵资料

プレスリリース

研究代表者

筑波大学 人工知能科学センター


掲载论文

【题名】
Non-readily identifiable data collaboration analysis for multiple datasets including personal information
(个人情报を含む复数データのための容易照合不可データコラボレーション解析)
【掲载誌】
Information Fusion
【顿翱滨】

関连リンク