엘에이 소식

"한인타운 정보 속속들이 알려드릴게요" 공공 데이터 처리 비영리단체 '소다비' 출범

최고관리자 0 126
한인사회 발전을 위해서 데이터 처리에 나선 소다비 운영진이 본지를 찾았다. 왼쪽부터 서연희 학생대표, 로렌스 한 고문, 김선호 대표, 박제호 사무국장.

한인사회 발전을 위해서 데이터 처리에 나선 소다비 운영진이 본지를 찾았다. 왼쪽부터 서연희 학생대표, 로렌스 한 고문, 김선호 대표, 박제호 사무국장.

작은 사진은 소다비 웹사이트.

작은 사진은 소다비 웹사이트.

"미주에서 한인이 영주권과 시민권을 취득하는 사람들의 자료를 분석해봤더니 의외로 여성이 남성에 비해 4배 많았습니다." 

이론으로만 알려져 있는 것을 논리적인 툴이나 도구로 실증해보는 것이 과학의 한 분야다. 누구나 그럴 것이라고 생각했던 것을 실제로 증명하는 것. 

통계나 데이터를 분석하여 증명하고 실생활에 쓸 수 있도록 돕는 비영리단체가 한인사회에 탄생했다.

바로 재미정보과학기술자협회 회장이며 USC공대 IMSC(Integrated Media Systems Center)센터 부소장인 김선호 박사가 앞장선 '소다비(Social Data Analysis and Visualization)'다.

김선호 박사는 "빅데이터 시대가 도래하면서 엄청난 양의 데이터가 쏟아져 나오고 있다"며 "그런데 우리 한인들이 세금을 내서 수집한 정부기관 데이터가 많다. 이런 오픈 데이터를 잘 처리하면 한인사회에 유용하게 이용될 수 있다는 것에 공감한 과학기술자들의 모임"이라고 설명했다.

"오픈데이터를 어떻게 가공하느냐에 따라서 한인사회나 한인 개인에게 필요한 정보가 될 수 있습니다. 저희는 공공 기관의 정보를 가공해서 한인사회에 내놓는 것이 사명입니다. 필요한 사람들이 그 필요성을 확인하고 로비를 하거나 기업체를 운영할 수 있도록 돕는 겁니다."

예를 들어 실제 오픈 데이터는 모든 인종, 모든 연령, 모든 지역으로 펼쳐져 있는데 소다비팀은 이를 한인과 관련된 데이터로 추출하여 웹사이트나 출판물을 통해서 한인사회에 제공하게 된다. 

최근에는 한인타운의 범죄 데이터를 분석해 웹사이트에 공개했다. 이 자료에 의하면 한인 상대 범죄는 언제 어디서 몇건 있었는지는 물론, 지역별, 길거리 코너별로 분석돼 있다. 

그렇지만 소다비 구성원들이 모두 전문 과학기술자들은 아니다. 김선호 박사를 비롯한 전문가 그룹과 이들과 함께 실제 데이터 추출과 분석작업을 진행하는 실무그룹에는 학생들이 참여하고 있다. 

학생들은 전문가들을 돕고 전문가들은 학생들에게 산 경험을 제공하므로 나중에 데이터 사이언스 관련 취업이나 직종에서 좋은 이력이 될 수 있다.

서연희 학생대표(USC컴퓨터사이언스 4학년)는 "참가 인원 중 경영학을 전공하는 학생 연구원의 경우 데이터사이언스 분야를 위해서 2학기 수업을 듣고 마땅히 경험을 쌓을 곳을 찾지 못했다"며 "하지만 지난해 수개월 동안 진행된 프로젝트 참여로 인해서 좋은 경험을 쌓았다"고 말했다. 

현재 데이터 사이언스가 크게 붐을 이루고 있는 분야지만 의외로 실제 경험을 쌓을 곳이 별로 없는데 소다비가 마침 그 역할을 해줄 수 있게 된 것이다.

또한 소다비는 자료를 비주얼 처리해서 정보처리에 문외한인 일반 한인들에게도 쉽게 접근할 수 있도록 비주얼 버전도 제공한다. 비주얼 버전은 영화사 드림웍스에서 일하는 팀(리더 이도민 부회장)이 참여하고 있다.

정보기술자협회와 우연히 미팅을 했다가 직접 참여하게 된 로렌스 한 고문은 "데이터라는 것이 0과 1로 이뤄진 것인데 모든 정보가 그것으로 이뤄졌다는데 감명을 받았다. 또 한인들을 위한 정보를 찾을 곳이 없다는 점에 착안, 이들을 돕기 위해서 열심히 참가하고 있다"며 "한인사회에 필요한 정보, 나아가서는 미주 한인 전체를 위한 정보 찾기, 정보 발굴, 정보 가공에 한인들의 더 많은 관심이 필요한 시점"이라고 말했다. 그는 또 "소수의 과학자들만 할 일이 아니고 개인과 단체들이 함께 참여했으면 좋겠다"고 덧붙였다. 

소다비팀은 오픈 데이터 처리 이외에도 임의 수집도 가능하다. 필요한 곳이 원하다면 협업의 문호도 열어놓고 있다. 

최근에는 한국에서 방영했고 ABC에서 리메이크해서 방영한 드라마 '더굿닥터'를 분석한 적이 있다고 한다. 얼마나 많은 사람이 트위터를 통해서 회자됐는지 자료를 모았고 평창 겨울올림픽의 전후해서 한국의 이미지가 얼마나 개선됐는지에 대한 정보처리도 가능했다는 것.

박제호 사무국장(하비머드칼리지 정보센터 부소장)는 "데이터를 분석해서 할 수 있는 일이 정말 많다"며 "예를 들어 시정부에 뭔가를 요청할 때 시에서 공개한 데이터를 근거로 설득할 수 있다"고 효용성을 강조했다.

▶웹사이트: www.sodavi.org ▶문의: sodavigroup@gmail.com
0 Comments
제목
Category
글이 없습니다.
State
  • 현재 접속자 3 명
  • 오늘 방문자 47 명
  • 어제 방문자 64 명
  • 최대 방문자 168 명
  • 전체 방문자 14,648 명
  • 전체 게시물 71 개
  • 전체 댓글수 18 개
  • 전체 회원수 3 명