이날 주영선생님은 방대한 양의 빅데이터를 주요 키워드 별로 정리해주는 소프트웨어를 소개해주셨습니다. 만약 사람이 직접 수많은 텍스트를 보고 키워드를 뽑아내는 일을 한다면 필요한 기간 내에 연구를 마치지 못할 확률이 큽니다.
그런데 주영선생님이 소개해주신 소프트웨어가 이 문제를 해결해줍니다. 이 소프트웨어는 방대한 텍스트의 키워드들을 보여주기도 하고, 이 키워드를 묶어서 그 관련 정도에 따라 범주화해 주기도 하고, 이 범주들 간의 관계를 그물 형태의 관계도로 보여주기도 했습니다. 이 관계도에서는 키워드 간 관계가 동일 문장이나 동일문단에서 자주 등장하는 가까운 관계일 수록 같은 위치에서 연결되어 있고, 키워드 간 관계가 서로 먼 관계일수록 다른 위치에 배치되어 있었습니다. 그리고 키워드 가 서로 같은 범주에 속할 경우 같은 색으로 표시가 되었습니다.
주영선생님은 이제까지 발표되었던 논문에서 "원격교육"의 키워드가 어떻게 변화했는지를 이 소프트웨어를 통해 연구했습니다. 시대별 방대한 논문의 키워드를 이 소프트웨어를 활용해서 비교적 단기간에 그 경향성을 살펴볼 수 있었습니다.
교수님과 박사 신입생 이현경선생님, 석사 신입생 박세진선생님, 그리고 곧 졸업을 앞두고 계신 강다현 선생님이 주영선생님의 발표에 몰입하고 계십니다. 특별히 교수님께선 주영선생님이 빅데이터 관련 연구를 할 수 있도록 새로운 컴퓨터와 이 소프트웨어를 구입해주셨습니다. 나중에 안 사실이었지만 이 소프트웨어의 1년 라이센스 가격이 상당했습니다. 이러한 지원 덕분에 현재 주영선생님의 연구가 가능한 것이었습니다.
가장 앞쪽에 TELD연구실 학생들의 리더이신 허선영선생님도 앉아계십니다. 모두들 다양한 관점에서 분석적으로 발표를 경청하고 있는 모습입니다. 워낙 흥미로운 주제였기에 발표 후 질문도 빗발쳤습니다. 우선 논문에서 어떻게 키워드를 추출해지는지에 관한 질문입니다. 키워드는 연구자가 사전에 선정할 수도 있고, 혹은 어느 한 텍스트를 프로그램에 입력한 후 키워드가 아닌 것들을 지워나가는 방식으로 초기 키워드를 선정할 수 있었습니다. 둘째로 활용가능한 언어에 대한 질문입니다. 한글이 안된다는 주영선생님의 답변을 듯고 저희들은 모두 아쉬워했습니다. 셋째로 비슷한 범주로 묶여서 같은 색으로 표시된 키워드와, 관계도에서 같은 위치에 존재하는 키워드의 차이에 대한 질문이 있었습니다. 비록 다른 색이지만 개념관계도에서 같은 위치에 있는 키워드가 존재했던 것입니다. '동일 범주'와 '가까운 관계'의 차이에 대해 저희는 궁금해 했습니다. 결국 이 시스템에서는 '동일 범주'를 키워드가 얼마나 물리적으로 연결되어 있는지에 따라 결정했기에, '가까운 관계'와의 차이가 명확하지 않았기 때문입니다. 이 문제에 대한 답변은 아직 미스테리로 남아있습니다. 그 이유는 주영선생님을 제외한 우리 모두가 소프트웨어를 활용해본 적 없이 강의를 통해 시스템에 대한 짐작만 해보았기 때문입니다. 그래서 10-1동 302호에서 이 소프트웨어를 활용해보고, 이 질문에 대한 답을 명확히 알아내려 합니다.
이처럼 주영선생님은 빅데이터를 처리하는 소프트웨어에 대해 상세하게 알려주셨습니다. 우리는 이 소프트웨어를 방대한 데이터의 경향성을 연구할 때 상당히 유용하게 활용할 수 있을 것이라 확신합니다. 좋은 소프트웨어를 접하고 활용할 수 있도록 소개해주신 주영선생님께 감사드립니다.
No comments:
Post a Comment
Note: Only a member of this blog may post a comment.