
● 네이버 DataLab이란 네이버의 데이터들을 분석하여 트렌드 및 통계 결과를 시각화하여 보여주는 사이트 검색어 트렌드, 쇼핑인사이트, 지역통계, 댓글 통계 제공 분류별 & 날짜별로 그날의 상위 검색어를 알 수 있다 구체적으로 클릭량과 그에 대한 추이 여자가 검색을 많이 했는지 남자가 검색을 많이 했는지 그 비율도 알려주고 PC로 검색했는지 모바일로 검색을 했는지도 알 수 있다. ● 패션의류 클릭량 추이 이외에도 지역별 검색어를 통해 그 지역에서는 무엇에 관심이 많은지를 알 수 있다 ● 강남구 인기 업종 관심도 강남구에서는 생활 관련 업종에 관심이 많아 검색량이 높은 것을 알 수 있다 이외에도 댓글 통계가 있으며 이러한 데이터를 쉽게 알아볼 수 있으니 자신에게 필요한 것을 찾아 잘 활용해보기..

미국의 조지아 공과 대학에서는 온라인 학습을 통해서 인공지능을 가르친다. 온라인 포럼에서는 학생들이 약 10,000개의 질문을 올리고, 인공지능 담당 교수인 아쇼크 고엘은 8명의 조교들과 함께 매해 약 300개 정도의 답변을 한다. 아쇼크 고엘 교수는 9번째 조교를 추가했는데, 그녀의 이름은 질 왓슨(Jill Watson)이다. 질 왓슨은 사실 사람이 아니고 IBM의 인공지능 시스템이다. 아쇼크 고엘 교수는 질 왓슨이 사람이 아닌 컴퓨터라는 사실을 알리지 않고 수업을 진행했다. 질 왓슨은 수업을 진행하면서 발생하는 학생들의 질문에 대해 빠르고 정확하게 답변했다. 그래서 학생들은 질 왓슨이 컴퓨터라는 사실을 전혀 인지하지 못했다. 어떻게 질 왓슨은 학생들의 질문에 빠르고 정확하게 답변하였을까? 그 해답은 ..

세상의 모든 분야와 영역에서 끊임없이 데이터가 생산되고 있다. 이렇게 생산된 데이터를 잘 수집하여 분석하면 세상을 이해하는 유용한 지식과 통찰력을 얻을 수 있다. 하지만 데이터 분석자가 데이터 분석 과정에 들어가기 전에 정제되지 않은 데이터를 잘 처리해 주지 않으면 제대로 된 분석 결과를 얻을 수 없다. 특히 데이터의 이상치와 결측치는 데이터 분석을 오류에 빠뜨리는 원인이 되므로 데이터 전처리 과정에서 잘 처리해 주어야 좋은 분석 결과를 기대할 수 있다. 이상치는 정상적인 범위 밖에 있는 값으로, 단 하나라도 존재하면 분석 전체에 큰 영향을 미칠 수 있다. 가령 하나의 이상치가 데이터 평균을 크게 바꿔 놓을 수 있다. 이상치는 데이터를 수집하는 과정에서 오류가 개입되어 발생한 것으로 간주되므로 찾아서 제..

딥러닝은 컴퓨터가 데이터를 사용하여 스스로 학습하는 방법이다. 쉽게 설명하면 두 발 자전거를 탈 때 처음에는 어려웠지만 계속 타고 많은 연습을 통해 점점 능숙해지는 것과 비슷하다. 딥러닝은 컴퓨터에게 문제를 많이 주고 컴퓨터가 이 문제들을 해결하게 돕는 것이 중요해서 많은 데이터가 필요하다. 예를 들어 고양이 사진을 인식하는 프로그램을 만들려고 한다고 해보자. 많은 고양이 사진과 그렇지 않은 사진을 사용해서 컴퓨터에게 어떤 것이 고양이인지 배우게 한다. 딥러닝은 이러한 데이터를 사용해 규칙과 패턴을 찾아내는 것을 컴퓨터의 학습이라고 생각하면 된다. 그리고 이렇게 학습한 정보를 사용하면 새로운 문제를 해결하거나 예측을 할 수 있다. 딥러닝 활용 예시 딥러닝은 음성 인식 기술에서 사용되어, 스마트 스피커가 ..