□ 데이터 제공 안내
❍ 대회 일정
※ 수상자 확인 및 대국민참여 투표는 헬스케어 빅데이터 플랫폼 메타포털 홈페이지에서 진행 ( https://cancerportal.kr )
※ 서류심사 발표 및 추후 일정은 사정에 따라 변경 가능
❍ (데이터 제공) 사전 신청한 참가자의 메일로 데이터 개별 발송 예정
- 제공일 : 2021.09.15.(수) 09:00
❍ (최종 결과물) 참가신청서 및 동의서, 아이디어 기획서, 알고리즘, PPT
- 서류 접수기간 : 2021.09.15.(수)~2021.09.30.(목)
※ 참가자는 알고리즘 소스코드를 제출해야 하며, 본 센터에서 추후 공개 예정
□ 합성데이터 소개
❍ (개요) 국립암센터 라이브러리 데이터[붙임1]를 기반으로 합성데이터를 가공하여 데이터 제공
❍ 합성데이터 : 실제 의료데이터를 활용하여 인공적으로 생성한 데이터
- 종속변수
· 유방암 환자 5년 이내 원내 사망 정보
· 대장암 환자 5년 이내 원내 사망 정보
· 폐암 환자 2년 이내 원내 사망 정보
❍ 활용 예시
- 지도 학습 (Supervised learing)
·학습데이터를 활용하여 다양한 인공지능 학습 모델을 구축하고, 검증데이터를 활용하여 해당 모델의 성능평가
·단, 검증데이터는 학습 모델에 활용 불가
- 비지도 학습 (Unsupervised learning)
·학습데이터와 검증데이터를 활용하여 데이터 안에 숨겨진 다양한 정보들을 탐색 및 추출 등의 분석 수행
·방법론의 독창성, 활용성, 규칙의 신규성, 군집화 등 평가
·군집화 (clustering), 연관규칙 (association rule mining) 등
□ 제공자료 안내
❍ 목적 : 2021 암 빅데이터 활용 인공지능 및 데이터 마이닝 활용 혁신서비스 발굴 아이디어 경진대회에서 제공하는 자료 설명
❍ 합성데이터 암종 : 유방암, 폐암, 대장암
❍ 테이블명세서 구성 : 테이블명, 변수명, 변수설명, 변수값 설명, 데이터 유형 정보 제공
□ 문의처
❍ (이메일) connectidea@ncc.re.kr
❍ (전화 문의) 암빅데이터센터 사무국 031-920-0651