데이터 큐레이션은 데이터 수집과 정제에서 어노테이션과 분류, 학습용 데이터 생성 등 데이터의 활용 가치를 높이기 위한 모든 활동을 의미 합니다. 데이터 기반의 심층 분석과 기계학습을 위해서는 대규모 데이터의 확보뿐 아니라 기계가 읽고(readable), 학습하고(learnable), 의미 이해 가능한(understandable) 형태로 가공 되어야 합니다. 데이터믹시의 데이터 큐레이션 서비스는 솔트룩스 20년의 데이터 품질관리와 기계학습 경험이 축적된 세계 최고 수준의 데이터 서비스를 제공합니다.
데이터믹시의 데이터 큐레이션 서비스는 지난 20년간 솔트룩스의 인공지능 연구과 제품 개발을 통해 누적된 대규모, 고품질 데이터 수집, 필터링 및 어노테이션 노하우가 집약되어 있습니다. 특히, 세계 최고 성능의 데이터 수집 플랫폼인 ‘토네이토’와 자체 보유한 국내외 전문 큐레이션 센터와 인공지능 연구소의 기술 지원을 통해 세계 최고 수준의 데이터 큐레이션 서비스를 제공합니다.
Garbage-In, Garbage-Out!빅데이터에 대한 관심이 크게 증가하던 초기에는 소위 데이터 양이 많으면 품질이 커버될 수 있다는 “양질 변환”이 가능하다 믿어졌었습니다. 그러나 글로벌 규모의 시장 및 경쟁자 분석, 위험 조기 감지, 투자 예측/관리 등의 대부분 심층분석에서는 데이터 양 만큼이나 그 품질이 더욱 중요함이 확인되고 있습니다. 특히, 딥러능을 포함한 기계학습 기반 인공지능 시스템 개발에서는 대규모 데이터 확보뿐 아니라 99.9% 이상의 정확도를 가지는 초고품질 학습 데이터의 확보가 더욱 중요해 지고 있습니다. (자율주행을 위한 이미지 어노테이션, 자연언어처리를 위한 말뭉치 등)
상용 수준의 실용적 인공지능 시스템 구현을 위해서는 모델의 높은 정확도뿐 아니라 기계학습을 위한 총 비용을 낮추는 것이 핵심 성공 요소가 됩니다. ‘Human-in-the-loop’는 기계학습 과정에 사람이 적절하게 개입함으로 비용을 낮추고 품질을 향상시키기 위한 방법론을 총칭합니다. 데이터믹시의 데이터 큐레이션 서비스는 ‘이중 나선 방법론’에 기반한 Human-in-the-loop’를 구현하고 데이터 큐레이션 센터의 기계학습 전문가와 글로벌 큐레이션 센터 및 크라우드 소싱을 통해 최적의 기계학습 프로세스 구현을 지원하고 있습니다.
이미지인식, 음성인식을 포함한 다양한 분류, 추천 등의 실용화된 기계학습(딥러닝) 모델들은 대규모, 고품질의 레이블된 학습 데이터를 필요로 합니다. 고품질 대규모 레이블 데이터를 확보하기 위해서는 막대한 비용이 듭니다. Active Learning(능동학습)은 레이블이 없는 대규모 원시 데이터로부터 교사학습에 최적화된 레이블 데이터를 반복적으로 확보함으로 낮은 비용으로 지능형시스템 구현하기위한 데이터 큐레이션 및 기계학습 방법입니다. 데이터믹시는 솔트룩스가 20년간 축적해온 인공지능 시스템 구현을 위한 Active Learning 경험을 데이터 큐레이션 서비스에 반영하고 있습니다.
파일을 삭제 하시겠습니까?
삭제한 파일은 복원이 불가능 합니다.
내용을 확인해주세요.
자세한 내용은 관리자에게 문의해 주세요.
죄송합니다.
요청한 정보를 찾을 수 없습니다.
잘못된 정보 입니다.
정확한 정보를 입력해 주세요.
완료되었습니다.
이용해 주셔서 감사합니다.
잘못된 정보입니다.
정확한 정보를 다시 입력해주세요.
이메일을 보냈습니다.
확인해 주세요.
파일을 삭제 하시겠습니까?
삭제한 파일은 복원이 불가능 합니다.
다양한 타입의 분석을 할 수 있습니다. 분석을 위한 데이터 타입을 선택해주세요
서비스 준비중 입니다.
빠른시일 내에 더 나은 서비스로 찾아뵙겠습니다.
감사합니다.
DATAMIXI 서비스(이하 “회사”)는 개인정보 보호법 제30조에 따라 정보 주체의 개인정보를 보호하고 이와 관련한 고충을 신속하고 원활하게 처리할 수 있도록 하기 위하여 다음과 같이 개인정보 처리 지침을 수립∙공개합니다.
회사는 개인정보를 다음의 목적 이외의 용도로는 이용하지 않으며 이용 목적이 변경될 때는 동의를 받아 처리하겠습니다. 회사는 수집한 개인정보를 다음의 목적을 위해 활용합니다.
이용자는 정보주체로서 다음과 같은 권리를 행사할 수 있습니다.
회사는 원칙적으로 개인정보의 보유 기간이 지났거나 처리목적이 달성된 경우에는 바로 해당 개인정보를 파기합니다. 다만, 다른 법률에 따라 보존하여야 할 때에는 그러하지 않습니다. 파기의 절차, 기한 및 방법은 다음과 같습니다.
회사는 「개인정보보호법」 제29조에 따라 다음과 같이 안전성 확보에 필요한 기술적, 관리적, 물리적 조치를 하고 있습니다.
개인정보보호와 관련된 궁금한 사항이나 개인정보침해신고/처리 문의는 회사에서 상담받으실 수 있습니다.
이 개인정보처리 방침은 2015년 7월 1일부터 적용됩니다.
본 서비스 약관은 회원이 Saltlux(이하 "회사")에서 제공하는 “DATAMIXI” 서비스의 이용과 관련하여 회사와 회원과의 권리, 의무 및 책임사항, 기타 필요한 사항을 규정함을 목적으로 합니다.
본 약관에 명시되지 않은 사항에 대해서는 전기통신기본법, 전기통신사업법, 전자상거래 등에서의 소비자 보호에 관한 법률 등의 관계법령 및 회사가 정한 서비스의 세부이용지침 등의 규정에 의합니다.
회사는 제5조 제1항 각호에서 정한 사항을 정확히 기재하여 이용 신청한 고객에 대하여 서비스 이용 신청을 승낙합니다.
회원은 이용 신청 시 기재한 사항이 변경되었을 경우 회사가 정한 별도의 이용 방법으로 정해진 양식 및 방법에 의하여 수정하여야 합니다. 회사는 회원이 변경 사항을 적시에 수정하지 않음으로 인하여 발생하는 문제에 대해서는 어떠한 책임도 지지 않습니다.
회사는 관련법령이 정하는 바에 따라서 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위하여 노력합니다. 회원의 개인정보보호에 관한 사항은 관련법령 및 회사가 정하는 개인정보처리방침에 정한 바에 따릅니다.
회사는 수집된 개인정보의 취급 및 관리 등의 업무(이하 “업무”)를 스스로 수행함을 원칙으로 하나, 필요한 경우 업무의 일부 또는 전부를 회사가 선정한 회사에 위탁할 수 있습니다. 개인정보의 위탁에 관한 사항은 관련법령 및 회사가 정하는 개인정보처리방침에 정한 바에 따릅니다.
회원은 서비스의 이용권한, 기타 이용 계약상 지위를 타인에게 양도, 증여할 수 없습니다.
(시행일) 이 약관은 2016년 6월 1일부터 시행합니다.
정보통신망법 규정에 따라 DATAMIXI 서비스 회원가입을 신청하시는 분께 수집하는 개인의 항목, 개인정보의 수집 및 이용목적, 개인정보의 보유 및 이용기간을 안내 드리오니 자세히 읽은 후 동의하여 주시기 바랍니다.
DATAMIXI 서비스 이용 시 사용자 식별을 위해 필요한 최소한의 개인정보를 수집합니다.
회사는 회원 관리, 서비스 개발・제공 및 향상 등 아래의 목적으로 개인정보를 이용합니다.
회사는 원칙적으로 개인정보의 보유 기간이 지났거나 처리목적이 달성된 경우에는 바로 해당 개인정보를 파기합니다. 다만, 다른 법률에 따라 보존하여야 할 때에는 그러하지 않습니다. 파기의 절차, 기한 및 방법은 다음과 같습니다.
이용자는 정보주체로서 다음과 같은 권리를 행사할 수 있습니다.
회사는 「개인정보보호법」 제29조에 따라 다음과 같이 안전성 확보에 필요한 기술적, 관리적, 물리적 조치를 하고 있습니다.
개인정보보호와 관련된 궁금한 사항이나 개인정보침해신고/처리 문의는 회사에서 상담받으실 수 있습니다.
이 개인정보처리 방침은 2016년 6월 1일부터 적용됩니다.
데이터를 불러오고 있습니다.
Warning transpose
The system only supports transpose with 2000 rows. Do you really want to transpose ?
분석타입
원본데이터란?
키워드에 대한 검색 결과 데이터로 분석에 사용되는 데이터 원본을 확인할 수 있다.
대표 차트
사용 가능한 차트들