알라딘

헤더배너
상품평점 help

분류국내저자 > 컴퓨터/인터넷
국내저자 > 번역

이름:정사범

최근작
2021년 8월 <파이썬 기반 강화학습 알고리듬>

데이터 스토리텔링

아마 여러분도 분석한 내용을 청중들에게 어떻게 하면 잘 설명할 수 있을까 하는 고민을 한 번쯤은 해보았을 것이다. 남들이 생각하지 못한 분석을 해내는 것도 중요하다. 하지만 이렇게 피땀 흘려 얻어낸 소중한 결과를 청중이 부담 없이 잘 이해할 수 있도록 하는 스킬도 이에 못지 않게 중요하다고 생각한다. 우리는 초등학교 때부터 그래프를 그리는 방법을 배웠고, 글을 잘 쓰기 위한 방법과 발표를 잘하는 방법을 배웠다. 그리고 이러한 방법을 익히고 연습해 본인만의 노하우를 습득했을 것이다. 아마도 태어나서 죽을 때까지 이러한 방법을 배우고 실천하는 데 많은 시간을 보낼 것이라고 생각한다. 우리는 분석 결과에 대한 발표자료나 보고서를 작성할 때마다 많은 어려움을 겪는다. 특히 데이터 분석 결과를 간단하면서도 이해하기 쉽게 시각화하는 것과 자신의 주장을 청중이 이해하기 쉽게 간단한 몇 문장으로 작성하는 데 어려움을 느낀다. 나 역시 10여 년을 넘게 회사에 근무했지만 발표자료를 작성하는 것은 늘 어렵다. 데이터 분석가는 매우 꼬여 있는 데이터를 살펴보고 도메인 지식과 연계해 의미 있는 결과를 도출해 내는 작업을 한다. 하지만 의미 있는 결과를 어렵게 도출했더라도 의사결정자를 설득시키는 데 실패한다면 매우 난처할 것이다. 물론 독특한 취향을 갖고 있는 청중도 있을 것이고 이들을 설득시킨다는 것은 더 어려운 작업일 수도 있다. 요약하면 데이터 분석도 중요하지만 의사결정자에게 분석한 결과를 쉽게 설명할 수 있도록 자료를 준비하는 것도 무시 못할 만큼 중요하다. 이 책은 데이터 분석 이후 발표자료나 보고서를 청중이나 독자가 쉽게 이해할 수 있도록 보여주기 위해 무엇을 중점적으로 고려해야 하는가에 대한 핵심 내용을 예제를 통해 설명한다. 특히 이론적인 내용은 물론 저자가 구글에 재직하면서 경험했던 수많은 노하우를 구체적인 사례를 통해 설명하고 있어 매우 유익하다.

머신 러닝 알고리즘

2016년 우리는 상당한 충격을 받았다. 알파고라는 인공지능(AI) 기술이 인간을 이겼다는 사실을 접하게 됐기 때문이다. 사실 AI 기술은 지난 수십 년 동안 연구돼 왔지만 인간을 능가하리라고는 생각하지 못했기 때문일 것이다. 하지만 2016년의 딥마인드의 알파고는 이러한 고정관념을 깨버렸고 AI 연구에 활기를 가져왔다. 이후에도 우리는 여러 뉴스를 통해 현실에서 AI를 이용한 성과가 공개돼 왔다는 사실을 매스컴을 통해 접해 왔다. 물론 기업 현장에서도 AI, 머신 러닝에 대한 관심이 예전보다 많이 높아졌고, 이를 이용해 혁신과 새로운 가치를 만들기 위해 노력하고 있다. 기업뿐 아니라 학계에서도 다양한 연구와 지원이 이뤄지고 있다. 다만 현재의 AI는 모든 것을 해결해주는 만능이 아니다. 즉 나름의 장단점을 갖고 있다. 예를 들어 AI가 결정한 내용에 대해 최종 사용자가 이해하는 데 어려움이 있다 보니 현장에 적용하는 데 어려운 점이 있다. 하지만 이러한 한계에 대한 부분도 '설명 가능한 AI(AIeXplainable AI)'를 통해 해결하려고 노력하고 있다. 이러한 새로운 기술에 대한 장단점을 분석하고 단점을 개선하려는 노력들 덕분에 AI가 실생활에 유용하게 사용되는 범위는 넓어질 것이라 생각한다. 이러한 측면에서 우리는 머신 러닝에 사용되는 여러 가지 유용한 알고리즘에 대한 방법의 이해와 구현이 필요하고, 이를 기반으로 여러 가지 이슈 사항을 해결하는 새로운 기술 개발 또한 필요할 것이다. 이 책은 이러한 필요성을 느끼는 사람들에게 데이터 전처리와 머신 러닝 방법을 소개하기 위한 것이다. 특히 파이썬을 활용해 머신 러닝을 구현해보려고 하는 사람에게 많은 도움이 될 것이라 생각한다. 각 장별로 해당 주제에 대한 간략한 설명과 파이썬으로 구현하는 예제는 현장에서 업무를 수행하는 엔지니어가 참고할 만한 내용을 담고 있다. 부디 이 책이 해당 업무에서 고군분투하고 있는 여러분들이 업무를 수행하는 데 일조할 수 있길 바란다.

산업인터넷(IIOT)과 함께하는 인더스트리 4.0

최근 들어 4차 산업혁명과 더불어 인공지능, 빅데이터, 스마트팩토리와 관련된 용어가 많이 회자되고 있다. 다만 다른 키워드에 비해 산업인터넷(IIoT)은 전문적인 용어의 냄새가 나며 구체적인 모습이 떠오르지 않는 측면이 있다. 하지만 생산 현장에서 사람과 데이터를 서로 연결시켜 설비 운영의 효율화와 비용 절감을 실행하기 위해 기반이 돼야 할 기술이 바로 산업인터넷이다. 즉, 분석을 통해 의미 있는 가치를 만들려고 하더라도 활용해야 하는 재료인 데이터를 모으고 이를 실시간으로 전송할 수 있는 인프라인 산업인터넷이 먼저 구축돼 있어야 한다. 이처럼 산업인터넷은 스마트팩토리를 구현하는 데 있어 든든한 기둥 역할을 해야 할 기술이다. 산업인터넷은 미국의 GE가 만들어낸 용어로 기계와 인터넷이 만나 데이터를 만들어내고 생산성을 높이며, 기계를 사용하는 인간이 '의사 결정'을 하는 데 있어 결정적인 역할을 하기 위한 기술이다. 특히 사물 인터넷 시장에서 상당한 비중을 차지할 것으로 예상되는 기술이기도 하다. 따라서 제조업에 종사하면서 미래 전략을 고민하는 분들은 센서, 빅데이터, 인공지능, 클라우드 같은 기술도 알아야 하지만 생산 설비에 센서를 부착한 후 여기서 나오는 대용량의 데이터를 어떻게 전송할 것인지에 대한 기술도 무시할 수 없는 중요한 측면이다. 이러한 상황에서 이 책은 어느 정도 도움이 되는 소개서라고 생각한다. 다만 상세한 기술을 소개하는 과정에서 통신 프로토콜이나 아키텍처 같은 사전 지식이 필요한 내용을 담고 있어 사전 학습을 한 후에 읽으면 내용을 이해하는 데 도움이 될 것이다. 방송이나 강연에서 회자되듯이 최근 제조업의 경쟁 원천이 '제품'에서 '플랫폼과 생태계'로 이동하고 있다. 이에 따라 소프트웨어 경쟁력 강화가 제조 혁신의 핵심이 되고 있다. 따라서 글로벌 제조 기업은 대규모 SW 개발자와 데이터 분석가를 채용하고, 경쟁력 있는 SW 스타트업에 아낌없이 투자하며, M&A를 통해서라도 자사의 SW 역량을 강화하고 있다. 심지어 GE 같은 회사는 제조업 중심에서 소프트웨어 기업으로 변신 중에 있다. 이러한 변환을 위해서는 이 분야에 대한 전문 지식을 갖고 사업 역량을 갖춘 인력을 적재적소에 배치시키고 역량을 100% 발휘할 수 있는 환경을 마련해주는 것이 매우 중요하다고 생각한다. 부디 4차 산업혁명에서 우리나라와 기업들이 경쟁력 있는 인재들을 많이 육성하고 이들이 갖고 있는 역량을 100% 이상 발휘할 수 있는 환경이 조속히 마련돼 글로벌 시장에서 좀 더 앞서나갈 수 있는 기회가 많이 생기기 바란다.

예측 분석 모델링 실무 기법

몇 년 전 <하버드 비즈니스 리뷰>에 데이터 과학자는 21세기의 가장 섹시한 작업이라는 제목의 저술 하나가 게재되었다. 덩달아 미국에서는 데이터 과학 분야의 인력수요가 증가할 것으로 예견하여 대학별로 커리큘럼이 개발되었고 MBA 과정도 개설되었다. 이처럼 최근 몇 년동 안 '빅데이터', '데이터 과학'이라는 용어는 매스컴에서 뜨거운 조명을 받고 있으며 많은 사람의 관심을 모으고 있다. 아마도 빅데이터에 대해 상세히 모르는 사람도 한 번쯤은 들어봤을 것이고, 막연히 빅데이터를 통하면 세상의 모든 어려운 문제들을 쉽게 해결해 줄 것 같은 신기루에 빠질지도 모른다라는 생각이 들기도 한다. 하지만 냉철하게 생각해보면 기업 입장에서는 빅데이터라는 최첨단 기술이나 분석방법에 관심이 있기보다는 실제로 업무에 적용해 얼마나 가치를 창출할 수 있는지에 더 많은 관심이 쏠린다. 따라서 데이터를 분석하는 사람이라면 데이터를 집계하는 것도 중요하지만 데이터의 의미를 읽을 줄 알아야 하며 이를 활용해 미래에 어떠한 일이 벌어지게 될지 예측하고 신속하게 대응할 수 있는 전략을 수립할 수 있어야 한다. 예를 들면 마케팅 데이터를 이용해 고객의 행동이나 시장의 변화를 예측하고 대응할 수 있어야 하며, 제품개발과 생산 데이터를 활용해 불량이 얼마나 발생할지, 설비에 어떠한 고장이 발생하게 될지를 미리 예측하고 대응할 수 있어야 한다. 은행이나 통신사의 경우에는 어떤 고객이 이탈하려고 하는지를 예측 분석하고 사전에 대응하여 이탈률을 최대한 줄일 수 있어야 하며 이것이 바로 의미 있는 일이라고 할 수 있다. 하지만 업무 분야에서 발생되는 데이터를 분석하기 위해, 직접 프로그래밍도 가능하고 사업전략을 수립하는 데 예측 분석을 이용할 수 있으며 이를 현장에 적용해 가치를 만들어 낼 수 있는 인력을 확보하는 것은 기업입장에서 정말로 어려운 일이다. 그렇다고 내부적으로 이러한 역량을 갖춘 인력을 육성하고 싶어도 수많은 시간이 소요된다. 해당 역량을 갖춘 인재는 실제 비즈니스 상황을 이해하고 이에 합당한 예측 분석 방법을 만들어 내야 하며 분석결과의 의미를 읽어낼 줄 아는 종합적인 사고가 필요하기 때문이다. 이 책은 복합적인 지식과 경험을 갖춘 데이터 분석가가 필요한 현 상황에서 데이터가 활용될 수 있는 분야(광고, 마케팅, 경제동향, 콜센터 운영, 야구경기, 브랜드, 주택문제 등)를 대상으로, 다양한 문제를 제시하고 이를 해결하기 위해서 어떠한 예측 분석기술을 활용할 수 있는지를 상세하게 설명한다. 단순히 데이터 분석기술에 대한 단편적인 설명보다는 실제로 데이터가 발생하는 현장에 있는 사람들이 어떠한 의사결정 문제를 고민하는지 구체적으로 설명하며 예측 분석 기술을 이용해 해당 문제를 해결한 사례를 상세히 다룬다. 따라서 이 책을 통해 독자는 실제 현장에서 업무를 개선하고 새로운 수익원을 창출하기 위해서 또는 현명한 공공정책을 수립하기 위해서 데이터 분석가가 어떠한 예측 분석을 하여 인사이트를 도출하고 전략을 수립했는지에 대한 실무 측면에서의 접근 방법을 알게 될 것이다. 아울러, 예측 분석 과정에서 데이터를 가시화해 표현하는 방법과 이를 데이터 분석용 언어인 R 코드로 구현하는 방안에 대해서도 매우 쉽게 설명한다. 특히 다저스 팀의 홈구장 관중수를 증가시키기 위한 캠페인 효과에 대한 예측 분석, 모바일 제품과 서비스에 대한 고객의 선호도 분석, 수퍼마켓 이용자의 구매행동 규칙 분석 및 예측, 미래 경제동향 예측 분석, 콜센터 운영안의 결과 예측 시뮬레이션 분석, 텍스트 분석, 감성 분석, 특정 야구팀의 경기결과 예측, 가상의 컴퓨터 브랜드와 가격에 따른 소비자 선호도 분석 및 예측 시뮬레이션 분석, 캘리포니아 주택가격 예측 등 우리가 실제로 빈번히 접할 수 있는 다양한 현실 문제를 해결해보는 방법을 보여줌으로써 예측 분석 기술이 실생활에서 어떻게 활용되는지에 대해 구체적으로 느껴볼 수 있다. 현재도 그렇지만 앞으로의 세상은 다양한 네트워크상에서 사람이든 기계든 상호 간의 작용을 통하여 다양한 형태(텍스트, 그림, 음악, 동영상 등)의 데이터를 발생시키게 될 것이다. 현재까지는 주요한 이슈가 이러한 데이터를 효율적으로 처리하는 기술이었다면 앞으로는 이를 활용해 어떠한 가치를 만들어 낼 수 있는가에 주목해야 할 것으로 보인다. 이미 이러한 움직임은 <가트너>에서 발표한 '2015년도 10대 전략기술 동향'에서도 엿볼 수 있다. 설리 가트너 부사장은 "기업은 사물인터넷, 소셜미디어, 웨어러블 기기에서 생성된 엄청난 양의 데이터를 적절히 분류해야 하며 알맞은 정보를 필요한 사람에게 제때에 정확히 전달해야 한다."라고 언급하기도 했다. 또한 "가치는 데이터 분석을 통한 답변에 있지, 데이터 그 자체에 있는 것이 아니다."라며 '고차원 분석(Advanced, Pervasive and Invisible Analytics'을 2015년 10대 전략기술로 꼽을 정도로 '분석을 통한 가치의 창출'에 중요성을 두고 있다. 이 만큼 '예측 분석' 기술의 가치는 알맞은 정보를 제 때에 필요한 사람에게 정확히 전달하고 가치창출을 위한 인사이트를 만들어 내는데 있어 매우 중요한 기술이다. 물론 분석 대상에 해당하는 분야에 대한 깊이 있는 이해가 동반되어야 가능한 일이기도 하다. 그만큼 다양한 분야의 지식과 기술 그리고 남다른 통찰력을 갖추어야 하는 것이 데이터 분석가가 갖추어야 할 자질이기도 할 것이다. 이러한 현실에서 이 책이 데이터 분석가가 되려는 분들이 좀 더 손쉽게 예측 분석 실무 기술을 익히는 데 큰 도움이 되기를 희망한다.

장고 마스터하기

파이썬이 이 세상에 나온 이후 여러 사람의 헌신적인 노력으로 다양한 분야에 활용되고 있다. 예를 들어, 파이썬 웹 프레임워크에는 장고가 있고, 데이터 분석 도구에는 판다스가 있으며, 이외에도 수많은 유용한 도구들이 파이썬 사용자를 지원하고 있다. 이 책은 파이썬 웹 개발 프레임워크인 장고를 배우려는 사람들을 위한 기본서다. 장고는 파이썬 언어로 작성된 빠른 응용 프로그램 개발 프레임워크로, 웹 프로그램 개발자가 신속하게 웹 애플리케이션을 만드는 데 도움을 준다. 따라서 이 책의 내용을 학습하면 웹 프로그램을 좀 더 효율적이고 효과적으로 개발할 수 있을 것이다. 프로그램을 개발하는 과정에 있어 기존에 이미 누군가가 개발했던 내용을 그대로 가져와서 재활용하거나 좀 더 개선하기를 희망한다. 그 이유는 소프트웨어 개발 측면에서 효율성과 신뢰성을 확보할 수 있기 때문일 것이다. 특히 웹 프로그램을 개발하는 경우에는 좀 더 절실하다. 이러한 목적을 갖고 나오게 된 것이 웹 프레임워크이고, 이것은 다양한 웹 프로그램들을 손쉽게 만드는 기반인 플랫폼이 되는 것이다. 따라서 이러한 도구를 활용한다면 복잡한 웹 프로그램을 상대적으로 적은 노력을 들여 빠르게 만들 수 있다. 무엇보다 장고가 배우기 쉬운 파이썬 언어에 기반을 두고 있다는 점이 초보 개발자의 입장에서 볼 때 큰 장점으로 보인다. 웹 개발 경험은 다양한 측면에서 많은 도움이 된다고 생각한다. 대용량의 웹 데이터 분석, 해킹, 웹 보안과 같은 업무를 수행하는 데 있어 웹 개발 경험은 필수라고 생각한다. 따라서 다른 언어에 비해 진입 장벽이 상대적으로 낮은 파이썬을 기반으로 하는 장고를 학습해 좀 더 다양한 경험을 할 수 있는 기반을 마련하길 바란다.

텐서플로로 구현하는 딥러닝과 강화학습

2016년 알파고의 등장과 더불어 인공지능, 신경망과 관련된 내용이 인터넷은 물론 미디어를 통해 회자되고 있다. 특히 딥러닝, 강화 학습은 전문가가 아니라도 어떤 의미를 갖는지 알 수 있을 정도로 일반적인 용어가 됐다. 당연히 이러한 분야의 책들도 다양하게 출간돼 여러 독자들에게 환영 받고 있다. 초기에 딥러닝, 강화 학습과 같은 최신 인공지능 분야에 대한 정보는 해외 원서나 저널, 웹 사이트를 통해 접할 수 있었기 때문에 일반인들이 정보를 접하기에는 한계가 있었다. 다행히도 최근에는 이 분야에 계신 분들의 노력으로 한글로 저술된 책이나 인터넷 매체를 통해 관련 정보를 좀 더 쉽게 접할 수 있게 됐다. 그만큼 우리나라에서도 이 분야에 대한 관심이 높아졌고 중요하게 생각하고 있다는 방증이 아닐까 생각한다. 이 책은 딥러닝, 강화 학습 등을 다루고 있지만 이론적인 내용을 다루기보다는 텐서플로를 이용한 구현 방법을 주요 내용으로 하고 있다. 따라서 이론적인 설명을 기대하고 이 책을 선택하는 독자보다는 간단한 이론을 포함한 구현을 배우고 싶어하는 독자들에게 좀 더 유용할 것이라고 생각한다. 원서의 초기 버전이 출간되었을 때에는 현 텐서플로 버전인 1.3이 공개되기 이전이었지만, 깃허브(github)에 최신 버전에 대한 코드가 올라와 있어서 이를 반영해 수정했다. 또한 오류로 의심되는 일부분에 대해서는 원저자에게 문의해 확인한 내용을 실었다. 여러모로 원저자가 의도한 내용을 정확하게 반영하고자 노력했지만, 오류가 있다면 모든 책임은 번역자인 나에게 있다고 볼 수 있다. 책을 읽는 중에 질문사항이 생기면 이메일이나 에이콘출판사 편집 팀으로 연락주기 바란다.

파이썬 프로그래밍 개론

사람이 태어나서 가장 먼저 배우는 것은 무엇일까요? 저는 타인과 커뮤니케이션 하는 방법을 배우는 것이라고 생각합니다. 이러한 이유 때문에 "인간은 사회적 동물이다"라는 말이 생겨난 것이 아닌가 생각합니다. 커뮤니케이션 능력은 인간이 삶을 살아가는 데 있어 매우 중요합니다. 따라서 우리는 태어나서 죽을 때까지 수많은 시간을 커뮤니케이션 하는 능력을 배우는 데 소비하고 있습니다. 즉, 다른 사람에게 내가 전달하고 싶은 것을 쉽고 명확하게 전달하기 위해 읽기, 쓰기, 말하기, 듣기 능력을 학습하는 것입니다. 그럼 우리가 프로그래밍 언어를 배우는 목적은 무엇일까요? 우리는 살아가면서 여러 가지 문제를 해결해야 하는 상황에 처하게 됩니다. 이를 위해 혼자서 밤을 세워 열심히 해결할 수도 있고, 주변 동료의 도움을 받을 수도 있으며, 기계의 도움을 받을 수도 있을 것입니다. 대부분의 경우 혼자서 일하는 것보다는 주변 동료와 협업하면 좀 더 효과적이고 효율적으로 업무를 처리할 수 있습니다. 게다가 기계와 협업하면 그 결과는 좀 더 좋아지지 않을까요? 우리가 동료와 커뮤니케이션을 잘하려고 노력하듯 기계와 커뮤니케이션 하기 위한 방법을 잘 아는 것도 필요합니다. 특히 앞으로 이러한 능력이 점차 중요해질 것입니다. 이미 우리가 모르고 있는 사이에 몇몇 분야에서는 기계가 인간보다 더 뛰어난 능력을 발휘하고 있습니다. 다만 이러한 변화의 물결이 과거와 달리 눈에 잘 안 보이는 가상의 세계에서 빠르게 이루어지고 있기 때문에 그 변화를 인지하지 못하고 있다고 생각합니다. 인간의 언어가 영어, 불어, 한국어, 중국어 등과 같이 다양하듯 프로그래밍 언어도 파이썬, 자바, C 등과 같이 다양합니다. 여러 프로그래밍 언어에서 파이썬은 점점 많은 사용자가 선택하고 있는 언어이기도 합니다. 인간의 언어 중 영어가 상대적으로 많은 분야에 사용되고 있듯이 프로그래밍 언어 중에서는 파이썬이 여러 분야에서 많이 사용되고 있습니다. 파이썬이 많은 사람들에게 선택 받고 있는 이유는 바로 이 때문입니다. 물론 한국인이 다른 언어에 비해 일본어를 상대적으로 쉽게 배우듯이 여러 가지 언어 중에서 파이썬이 배우기 쉽기 때문이기도 할 것입니다. 특히 최근 들어 파이썬은 데이터 분석, 인공지능 분야에서 많은 주목을 받고 있는 언어 중 하나입니다. 데이터 분석가가 쉽게 사용할 수 있다는 장점도 있지만 파이썬을 이용한 다양한 분석 사례도 있습니다. 한 가지 예로 Kaggle에 가보면 Python을 사용한 사례를 구해볼 수 있고, 최근 이슈가 되고 있는 딥러닝, 머신러닝을 구현하기 위한 구글에서 만든 도구 또한 Python에 기반을 두고 있습니다. 누구나 그렇듯이 프로그래밍을 처음 배울 때는 어렵습니다. 하지만 꾸준히 공부하다 보면 본인만의 노하우가 생길 것입니다. 아무쪼록 이 책이 여러분들이 프로그래밍의 세계에 입장하여 활발한 활동을 하는 데 도움이 되기를 바랍니다.

파이썬으로 풀어보는 수학

학교를 다녀본 사람들이라면 학창시절에 누구나 수학, 영어와 관련한 참고서도 많이 사고 공부도 열심히 했을 것이다. 성적이 좋게 나오는 것과 상관없이 누구나 이러한 경험이 있을 것이다. 지금 학교를 다니고 있는 중고등학생들도 아마 다르지 않을 것이라 생각한다. 수학과 관련된 누구나 다 알고 있는 참고서의 누적판매량이 우리나라 총인구 수준에 육박할 만큼 팔려 나간 것으로 추정된다고 하니, 아직도 수학은 우리 학생들에게는 열심히 해야 하는 과목이라고 생각된다. 프로그램은 어떠할까? 아마도 수학만큼은 아니겠지만 관심이 있는 학생들이라면 프로그래밍 언어 하나는 배우고 있을 것이다. 이러한 언어 중에 최근 들어 인기가 있는 언어 중의 하나가 파이썬이다. 나는 수학과 프로그래밍 언어를 한 번에 익힐 수 있을 만한 책이 있으면 좋겠다고 생각했는데, 바로 이 책이 찾고 있었던 책이었다. 이 책을 번역하게 되어 영광으로 생각한다. 2016년 초에 우리나라는 알파고 열풍이 일었다. 아마도 다들 알겠지만 인공지능의 위력을 가장 쉽게 접할 수 있었던 사건이었지 않을까 생각한다. 바둑을 시작하기 일주일 전만 해도 컴퓨터가 어떻게 사람을 이길 수 없을 것이라고 생각한 사람들이 대부분일 것이다. 하지만 이러한 생각은 이젠 잘못되었다라는 것을 명백히 입증한 것이 이번 알파고 사건이다. 물론 컴퓨터가 사람을 이길 수 있도록 하기까지는 수학과 컴퓨터 프로그램이 어느 정도 역할을 했다는 데는 이견을 갖는 사람은 없을 것이다. 이처럼 프로그램을 통해 무언가를 만들고자 하는 사람에게 있어 수학은 매우 중요한 학문이다. 수학적 사고가 없이는 좋은 프로그램을 만들 수 없기 때문이다. 또한 수학적 이론을 잘 알고 있는 사람에게 있어 프로그램은 매우 중요한 기술이다. 특히 데이터를 분석하고 알고리즘을 개발하는 경우, 이를 프로그램으로 효율적으로 구현하는 능력이 떨어진다면 본인조차도 상당히 답답할 것이다. 따라서 수학과 프로그램 언어는 서로 같이 배우고 익히는 것이 필요하다라고 생각한다. 하지만 우리나라의 교과과정에서는 수학과 컴퓨터를 같이 배울 수 있는 기회가 그리 많지 않은 점이 아쉽다. 아마도 경험해보았겠지만 수학적 이론을 프로그램으로 구현해보고 컴퓨터상에서 시뮬레이션해보는 경험은 참 재미있는 일이다. 아마도 실제로 해보지 않는다면 이러한 재미를 실감할 수 없을 것이라 생각한다. 이와 같은 재미를 느끼는 데 이 책이 어느 정도 기여를 했으면 하는 마음이다.

R에서 객체지향 프로그래밍 사용하기

내가 R 언어를 알게 된 지 어느덧 10년 정도 되었다. 그 때만 하더라도 R을 다룬 책은 외국 서적이 대부분이었고 관련 자료 중 대부분이 공식 R 사이트에서 제공한 매뉴얼 형태의 pdf 파일이었던 것으로 기억한다. 하지만 최근에는 R 언어와 관련된 국내 서적만 검색해보아도 수십 종에 달할 것으로 짐작된다. 아마 최근 몇 년간 출간된 데이터 분석 관련 도서들 중에서 R과 관련된 책이 가장 많은 비율을 차지하지 않을까 생각한다. 이처럼 R과 관련된 다양한 책들이 쏟아져 나오고 있다는 사실은 데이터 분석가들 가운데 상당수가 R을 사용하고 있으며, 데이터 분석 분야에 종사하기를 희망하는 학생들 또한 R에 관심이 많다는 것을 입증한다고 볼 수 있다. 전 세계적으로 R 언어 사용자가 늘어남에 따라 다양한 종류의 관련 책들이 나오고 있다. 물론 인터넷상에서 구할 수 있는 자료의 수와 종류도 최근 들어 다양해지는 것이 사실이다. 이 책은 이러한 추세를 감안해 R 언어의 기초를 간략하게 소개하고 R에서 어떻게 객체지향 프로그래밍을 할 수 있을지에 대한 내용을 소개한다. R에 대한 기본 내용을 익히고 나서 고급 기술을 더 배우고자 하는 분들에게 이 책은 큰 도움이 될 것이다. 특히나 R 언어의 객체지향 프로그래밍을 설명한 책은 찾아보기가 쉽지 않을 뿐 아니라 인터넷상에서도 관련 자료를 쉽게 구할 수 없다는 측면에서, 이 분야에 관심이 많은 분들에게 이 책이 어느 정도 정보를 제공하는 기회가 될 수 있으므로 기쁘게 생각한다. 특히 이론만 설명하는 것이 아니라 예제를 통해 설명하고 있으므로 구석구석 상세히 읽어보면 R을 좀 더 잘 활용하게 될 것이라고 믿는다.

The R Book (Second Edition) 한국어판

흔히들 빅 데이터를 디지털 원유라고 부르며 이를 분석하면 막강한 정보력을 갖출 수 있다고들 합니다. 최근 몇 년 동안 빅 데이터는 IT 분야에서 큰 이슈가 되고 있으며 이러한 움직임은 한국에서도 화두가 되었습니다. 이러한 현상은 다양한 컨퍼런스와 세미나, 학회, 온/오프모임이 생기는 것만 봐도 알 수 있습니다. 정부와 기업에서는 빅 데이터 관련 R&D, 인력 양성, 관련 조직을 구성하고 있으며 일부 프로젝트에서는 의미 있는 결과물을 만들어내고 있습니다. 이로 인해 최근 들어 서비스나 제조업 관련 기업에서 관심을 갖기 시작하고 있는 분야라고 할 수 있습니다. 유럽과 미국을 위주로 해 10여 년 전부터 데이터 분석 영역은 다양한 학회와 연구 활동이 있었고, 이를 기반으로 데이터 분석 전문인력 양성을 위한 다양한 과정이 운영되어 왔습니다. 최근 들어 국내에도 데이터 분석 전문인력을 양성하기 위해 대학에서도 다양한 과정이 생기고 있는데, 이는 상당히 고무적인 일입니다. 또한 온/오프 형태로 현업 종사자들이 모여서 R 언어를 포함한 빅 데이터 정보를 공유하고 있습니다. 데이터를 분석하는 데 반드시 필요한 것은 해당 영역에 대한 지식, 분석 툴, 분석 방법이라고 할 수 있습니다. 3가지 요소 중에 R 언어는 분석을 위한 대표적인 툴 중의 하나입니다. 따라서 전문인력 양성 과정에는 데이터 분석 툴과 분석 방법이 반드시 포함되어 있어야 할 것입니다. 해외는 물론 국내에 다양한 온오프 모임과 교육 과정이 개설되었으며 관심을 갖는다면 해당 과정을 등록해 수강할 수 있습니다. 조금만 관심을 갖는다면 이 책을 포함해 데이터 분석 방법을 배울 수 있는 기회는 다양하며, 손쉽게 찾아볼 수 있습니다. 현업에 계신 분들은 아시겠지만 데이터 분석은 혼자서 하는 작업이 아닙니다. 데이터 분석 결과에 의미가 있으려면 반드시 분석 대상이 되는 분야에 대해 깊이 이해해야 합니다. 이러한 기반하에서 관련 데이터를 모으고 프로그래밍 기술과 데이터 분석 기술, 통찰력을 발휘하여 의미 있는 결과를 만들어내는 것입니다. 따라서 데이터 분석을 제대로 하려면 다양한 분야에 대한 이해와 지식을 바탕으로 해 데이터 분석 방법을 만들어 내고 툴을 사용해 데이터를 분석해야 합니다. 이러한 측면에서 분석 방법과 분석 툴 분야에 대한 분석가의 역량 개발에 있어 이 책은 좋은 참고 도서가 될 수 있습니다. 기존의 다른 책과는 달리 R의 사용법부터 시작해 실제 업무에 필요한 다양한 통계 분석 방법을 R 언어로 분석하는 과정을 상세하게 보여줍니다. 이 책은 초판이 출간된 이후 2012년에 베이지안 분석과 메타 분석이 추가되어 개정 출간된 버전을 번역한 책입니다. 원서가 R 언어와 분석 방법을 다양하게 다루다 보니 1,000페이지가 넘는 상당히 많은 분량이었으며 번역하는 데에도 상당한 시간이 소요되었습니다.

가나다별 l l l l l l l l l l l l l l 기타
국내문학상수상자
국내어린이문학상수상자
해외문학상수상자
해외어린이문학상수상자