겨울 학기동안 공부 혼자 공부할만한 아래의 책 4권을 빌렸다.
- Mining the Social Web
- Practical Text Mining
- Natural Language Processing with Python
- Pattern Classification
내가 이것들로 시험을 볼 것도 아니기 때문에, 구체적인 계획은 없다(어떤 책은 아예 안 펼칠 수도 있다).
그때그때 손에 잡히는 대로 공부해보고 글을 쓰려한다. 일단은 소셜 웹 마이닝부터 보겠다.
예제 코드는 IPython을 이용한다. (소스 코드)
순서는 크게 아래와 같다.
- 트위터 마이닝
- 페이스북 마이닝
- 링크드인 마이닝
- 구글플러스 마이닝
- 웹 페이지 마이닝
- 메일박스 마이닝
- 깃허브 마이닝
- 의미론적 마크업 웹 마이닝
- 트위터 쿡북(?)
일단 순서에 맞춰 트위터 마이닝부터 다음 포스트로 올려야겠다.