연구개발 과정에서 다루는 데이터는 개인정보를 포함하는 중요한 자산입니다. AI 기술 발전과 함께 데이터의 활용이 늘어나는 만큼, 보안 위협 역시 복잡해지고 있습니다. 저 역시 연구를 진행하다 보면 수집되는 방대한 데이터를 어떻게 관리해야 할지 고민되는 경우가 많았는데요. 이종현 박사님께서는 연구자들이 법적 제재와 기술 유출을 막고 연구 윤리를 지킬 수 있도록, 데이터의 생애주기(생성, 수집, 가공, 보유, 이용, 분석, 제공, 폐기)에 따른 필수적인 보안 원칙을 설명해 주셨습니다.
데이터 관리의 초기 단계인 생성, 수집, 가공, 보유 과정에서는 보안 환경을 구축하고 민감 정보가 연구 데이터에 스며들지 않도록 하는 것이 핵심이라고 하는데요. 연구 시작 단계에서부터 시스템의 보안 수준을 기획하고, 외부 출처로부터 데이터를 수집할 때는 기관 기밀정보 및 개인정보를 필터링 도구로 제거해야 한다고 설명해 주셨습니다. 가공 단계에서는 고유식별정보를 삭제하거나 가명 처리하여 재식별 위험을 낮추는 것이 핵심이라고 말씀해 주셨습니다. 이후 데이터를 서버나 연구노트에 보유할 때는, 평소에 당연하게 생각하는 말들을 지키고 실천하는 것이 정말 중요하다는 점을 느낄 수 있었는데요!😊 특히 중요 개인정보는 반드시 암호화하는 등 기술적 보호조치와 더불어 보안등급 설정 및 잠금장치 보관과 같은 물리적 통제를 병행해야 한다고 합니다🔒
데이터가 실제 활용되는 이용, 분석, 제공 단계에서는 정보의 무결성을 확보하고 외부 노출에 대비해야 한다는 점이 강조되었습니다. 데이터를 이용하는 과정에서 해킹보다 업무 과실이나 내부자 행위로 인한 유출이 더 빈번하므로😈 , 개인정보 접근 권한은 업무에 필요한 최소한으로 부여하는 '최소 권한 원칙'을 철저히 지켜야 한다고 말씀해 주셨는데요. 함께 말씀해주신 생생한 사례를 들으며, '나는 저런 실수를 하지 말아야겠다' 싶어 식은땀이 흐르기도 했습니다💦 특히 AI 분석 결과는 환각 현상으로 인해 잘못된 정보를 사실처럼 제시할 수 있으므로, 최종 결정을 내리기 전에는 다중 출처를 통해 정보의 교차 확인이 필수적이며, 보고서 등에 원본 데이터가 포함되어 의도치 않게 민감 정보가 노출되지 않도록😱 주의해야 한다는 걸 다시 느낄 수 있었습니다.
시간이 지나며 점점 다양한 연구에 참여하고 있는 석사과정 학생의 입장에서, 연구원으로서 데이터를 다룰 때 기술적으로 그리고 윤리적으로 고려해야 할 점이 무엇일지 배우고 성찰할 수 있었던 소중한 시간이었습니다. 좋은 자리를 마련해주신 학습과학연구소에도 감사드립니다~~!!😍🥰
No comments:
Post a Comment
Note: Only a member of this blog may post a comment.