책제목 : 처음 배우는 데이터 과학
저자 : 필드 케이디
출판사 : 한빛미디어
책 표지에는 통계, 수학, 머신러닝, 프로그래밍까지 데이터 과학자를 꿈꾸는 히치하이커를 위한 최고의 안내서라고 되어있다.
데이터 과학을 공부하려면 어디서부터 시작해야 할지 모르는 사람들이 가벼운 마음으로 읽을 수 있는 입문서이다.
데이터 과학 분야에서 필요한 다양한 능력과 기술을 책 한 권에 담으려고 하다 보니 목차만 17 페이지나 된다.
개념을 잡기에 좋은 것 같은데, 너무 많은 분야를 총망라하다 보니 입문자가 이걸 보고 이해를 할 수 있을까 하는 생각이 들기도 했지만, 어떤 용어들이 있는지는 확실히 알 수 있을 것 같긴 하다.
저자는 첫 장에 데이터 과학 유니콘이 되자!라고 합니다.
데이터 과학의 정의로 데이터 과학은 소프트웨어를 개발하며 뭔가를 분석하는 작업이라고 합니다.
정확한 통계 모델을 세우고 그걸 소프트웨어로 구현할 줄 알면서 사업에 대한 감각까지 있는 사람을 영어권에서는 유니콘이라고 부른다고 한다. 확실히 저자는 데이터 과학 유니콘이 되는 법을 알려주려다 보니 420쪽 정도 되는 그렇게 두껍지 않은 분량에 다양한 개념들을 설명하다 보니 설명이 그렇게 자세하진 않다. 요약 참고서를 읽는 느낌 정도 되겠다.
데이터 과학 로드맵
문제파악 --> 데이터 분석 및 이해 --> 특정값 추출 --> 모델수립 및 분석 --> 결과 정리 및 발표
--> 코드 배포
현업에서 이 전부의 과정을 할 수 있는 사람이 있긴 한가?
프로그래머들은 주로 소프트웨어 프로그래밍하여 특정 값을 추출하는 부분까지
통계학자들이나 경영학자들이 모델 수립 및 분석 결과 발표
다시 프로그래머들이 코드 배포
이렇게 분업을 하는 경우가 더 많을 것 같다.
프로그램도 하고 수학도 하고 머신 러닝 알고리즘도 알아야 하고 메모리 성능까지 알아야 한다니 먹고살기 힘든 세상이다.
왜 파이썬을 쓸까?
1. 데이터 과학에서 파이썬은 독보적인 지위를 갖고 있다. 무료로 사용할 수 있는 언어 중에 유일한 경쟁자로 R이 있지만 거의 모든 면에서 파이썬이 더 낫다.(아주 드물게 R에서만 제공하는 통계 관련 기능이 필요한 경우도 있음)
2. 파이썬은 범용 언어이므로 어떤 작업을 하든지 무난하게 사용할 수 있음. 예를 들어 통계, 연산, 웹 분야를 각각 개발한다고 했을 때 프로그래밍 언어로 파이썬을 선택하지 않을 수도 있음. 그렇지만 데이터 과학 분야에서 프로젝트를 진행하다 보면 다양한 분야에 걸쳐 작업을 하기 마련이라 범용 언어를 선호하게 됨. 그러므로 다양한 분야가 융합된 데이터 과학 같은 분야에서 파이썬만큼 좋은 언어는 없음
파이썬의 인기 외부 공학용 라이브러리
- 팬더스 Pandas
데이터를 표 형태의 데이터프레임에 넣어서 쉽게 이용할 수 있게 함. 속도도 빠르고 API도 훌륭
- 넘파이 Numpy
숫자 배열을 효율적으로 이용하는 데 필요한 도구
직접 넘파이를 쓰는 것은 조금 저 수준, 팬더스는 넘파이 배열 및 문법과 호환이 잘 됨
- 사이킷런 Scikit-learn
넘파이를 기반으로 작동하는 머신러닝 라이브러리
보통 팬더스로 데이터를 불러오고 그 데이터를 넘파이 배열로 바꾼 뒤 사이킷런에 넣어서 머신러닝 이용
- 맷플롯립 Matplotlib
데이터를 시각화하는 데 사용하는 도구
직접 사용하기엔 복작하고 지저분할 수 있는데 팬더스에서 제공하는 맷플롯립 기반 고수준 API를 사용해 시각화
- 사이파이 SciPy
넘파이 배열을 기반으로 빠른 수학 연산을 할 수 있게 도와줌
확률, 통계, 알고리즘, 최대 우도 추정, 고급 분류기, 확률 과정은 확률, 통계 개념이 너무 없어서 수식을 보는 것만으로 골치가 아파졌다.
파이썬 실력을 조금 더 쌓고 다시 봐야 할 것 같다.
![]() |
|
'책' 카테고리의 다른 글
[운동은 몸뿐만 아니라 정신까지 건강하게 한다]마녀체력-마흔, 여자가 체력을 키워야 할 때 (0) | 2020.02.28 |
---|---|
[하루에 3만 보씩 심지어 10만 보까지]걷는 사람, 하정우 (0) | 2020.02.26 |
[속임수의 시대는 끝났다. 이제는 다르게 마케팅 할 때이다.]마케팅이다. (0) | 2020.02.14 |
[돈만 있으면 백수가 체질이지만 일만하느라 인생을 낭비하고 싶지 않은]지속가능한 반백수 생활을 위하여 (0) | 2020.02.03 |
[너무 힘들어서 포기하고 싶을때 추천 : 아침이 오지 않는 밤은 없다]어느날 400억원의 빚을 진 남자 (0) | 2020.01.30 |
댓글