4 research outputs found

    Big data:Lessons for employers and employees

    Get PDF
    Purpose: The focus of the current article is to critically reflect on the pros and cons of using employee information in big data projects. Approach: The authors reviewed papers in the area of big data that have immediate repercussions for the experiences of employees and employers. Findings: The review of papers to date suggests that big data lessons based on employee data are still a relatively unknown area of employment literature. Particular attention is paid to discussion of employee rights, ethics, expectations, and the implications employer conduct has on employment relationships and prospective benefits of big data analytics at work for work. Originality/value: This viewpoint article highlights the need for more discussion between employees and employers about the collection, use, storage and ownership of data in the workplace. A number of recommendations are put forward to support future data collection efforts in organisations

    Breaking Anonymity of Social Network Accounts by Using Coordinated and Extensible Classifiers Based on Machine Learning

    No full text
    Part 5: Impression, Trust, and Risk ManagementInternational audienceA method for de-anonymizing social network accounts is presented to clarify the privacy risks of such accounts as well as to deter their misuse such as by posting copyrighted, offensive, or bullying contents. In contrast to previous de-anonymization methods, which link accounts to other accounts, the presented method links accounts to resumes, which directly represent identities. The difficulty in using machine learning for de-anonymization, i.e. preparing positive examples of training data, is overcome by decomposing the learning problem into subproblems for which training data can be harvested from the Internet. Evaluation using 3 learning algorithms, 2 kinds of sentence features, 238 learned classifiers, 2 methods for fusing scores from the classifiers, and 30 volunteers’ accounts and resumes demonstrated that the proposed method is effective. Because the training data are harvested from the Internet, the more information that is available on the Internet, the greater the effectiveness of the presented method


    Get PDF
     近年,SNSにおけるプライバシーの侵害が問題となっている.プライバシーリスクを明確化するために,先行研究では同一人物による複数のアカウントを特定する手法が提案されている.本研究ではリスクをより明確化するために実世界の個人を特定する手法に焦点を当て,機械学習を用いてTwitterアカウントと就職希望者の履歴書を照合することで,匿名の発言の投稿者を見つける先行研究を取り上げた.これらの信頼性を高めるとともに,SNSから投稿者が持つ属性をプロファイリングしその精度を確認,分析することで推定されやすい人物の持つ性質を考察した. プロファイリングについては,Twitterの投稿文から投稿者の属性を推定した.教師データについてはデータセットを正例,負例共に最大100人と先行研究より増加させ,また被験者を78人に変更し,属性数を大幅に増やして精度を確認した.結果,最も識別精度の高い属性カテゴリは性別であり,学歴,帰省先住所と続いた.ここで複数の被験者について,履歴書に記入されていなかった属性の推定値が高かったことから,投稿者の潜在的な属性の推定についての可能性を示した. 投稿者の隠れた属性の推定については,申告されていないが機械学習によって本人のものと推定された属性が実際に正しいのかを分析し,それにより潜在的な属性を見つけることができる可能性を示した.機械学習による属性推定とアンケートによる事後申告により,14人中10人については事前に申告がない属性についても,本人のものと推定された属性のアンケートスコアが実際に高くなっていた. 個人特定については,78人中29人を正しく特定し,78人中65人を1割(すなわち上位7位)以内に絞り込むことができた.これは先行研究の結果(30人中6人を特定)を上回る.また学内被験者では27人中12人,学外被験者では51人中27人を正しく特定した.電気通信大学201