'에이콘'에 해당되는 글 2건

  1. 2008/07/14 정보트래핑 - 체계적인 정보 찾는 법을 안다
  2. 2005/04/25 조엘 온 소프트웨어

정보트래핑(원하는 정보를 자동으로 수집하는 웹 모니터링 기법) (2008/07/13)
타라 칼리셰인지음/yuna옮김|에이콘| 2007.10.20 | ISBN 9788960770218


책에 쓰인 기술은 알고 있기에 어떤 내용일까? 란 당연한 궁금함과 이런 류의 책은 술술 읽힐 수 있을까? 란 발전된 궁금함에 잡았다. 미국 사이트가 많이 안내 되어 있는게 아쉽긴 했다. 한국에 유사 사이트가 있는지 찾아보면 제법 있을 터인데......

1. 주제를 고려해 신중하게 검색문을 작성한다.
2. 검색할 수 있는 자료들을 살펴보고 평가한다.
3. 검색문을 작성한다.
4. 결과를 받아 보고 평가한다.-p17

키워드: RSS, RSS Feed, 이메일 알림, 페이지 모니터, 멀티미디어 트래핑, 태그와 태화의 트래핑, 위키위키, 제외 검색어, 개인 자체 블로그 운영.

[기억에 남는 구절]
이 책의 목적을 알면 쉽게 읽힌다.
이 책은 바로 이렇게 정적이고 일회성에 그치는 웹 검색이 아니라 계속해서 변화하는 정보를 '낚아들이는trapping' 것, 최대한 자동화된 방법으로 지속적으로 정보를 수집하는 일에 대해 다룹니다.-p16
=>살아 있는 물고기(검색하는 데이터 자체가 변화한다는 것)를 제대로 낚는 법(트래핑)을 알아야 한다.
Posted by iarchitect

조엘 온 소프트웨어 - 유쾌한 오프라인 블로그 (2005/04/25)
조엘 스폴스키 지음/박재호, 이해영 옮김| 에이콘 | 2005년 04월 07일

역자가 마음에 든다. 그는 스티븐 맥코넬의 [프로젝트 쾌속 개발 전략(Rapid Development)]도 번역했는데, 괜찮다.

4장의 유니코드와 문자집합이란 장은 재미나고 깔끔했다. mySQL과 웹애플리케이션과 서비스를 구축하는 나에게도 실체로 와닿고 있다. 예전엔 생각지 못했는데 말이다. gmail.com에서 한글이 깨지는 것과 mysql의 세팅에 따라 한글이 보였음하고 삽질하는 나를 볼때 말이다.
-> 이젠 gmail.com 에서 한글이 깨지지 않는다
..
그게 싫다면 집에가서 아기나 봐야 될지 모르겠습니다란 ... 1장의 글에서 전문성에 대한 화두를 또 한번 발견한다. 회사경험 5년차 난 정말로 전문성이 있는가? 요새 읽고 십여 권의 책 독후감을 써야 되는데 ...이론 바쁘다는 핑계보다 그 책들이 링크되어져있는게 문제다
...

8장 손쉬운 기능명세 작성법 을 읽는데 http://www.construx.com/survivalguide/desspec.htm  이란 url을 찾을 수 있었다. 내가 좋아하는 스티븐 맥코널이다. 이 사람도 은연중에 자기가 옳다는 주장을 하고 있음을 잊지 말고 읽자 신토피컬 독서!!

지금 읽고 있는 부분에서의 이슈는 상황론인 것 같다. 그때 그때 맞는 적절한 도구를 이용하라는 말인지도 모르겠지만, 여하튼 xp를 그리 좋은 방법론으로 보지 않고 있다. 음... http://xper.org 에선 어떻게 말하고 있을까?

유닉스 철학과 원도 철학에 관한 이야길 하는데 갈수록 이사람의 일방성에 반감이 생기는 부분도 있다. 필체는 대부분 내가 MS를 다닐때 이랬고, 자기 product에 관한 이야기가 거슬리기 시작하누만.

그리고 한국여건으로는 그 사람이 적었던 100mb 자료 올리고 내리는 거 정도는 일반화 되어 있음을 모르는 부분도 분명 있다.

[기억에 남는 구절]
* Binary Lagre OBject(BLOB) -p6
* 문자열의 첫 바이트에 바이트개수를 저장하는 방법으로 이를 해결했습니다. 바로 이런 문자열을 파스칼 문자열이라고 합니다. -p10
* 비록 정도는 약하지만, 전형적인 malloc구현을 따를 경우에도 가비지 컬렉션과 유사한 성능 저하 문제가 생기니까요.-p14
* 버그는 발견 즉시 수정해야 합니다. -p28
* 새로운 기능을 소개했다면, 축적된 대규모 버그를 수정하는 작업 없이 해당 기능을 구현해서 즉시 출시할 수 있습니다. p29
=> 이 앞에 내용이 경쟁사에 발 빠르게 대응할 수 있다는 장점....의 이야길 나왔다.
* '명세 없이는 코드도 없다'는 단순한 규칙을 일관되게 주장해야 합니다.-p31
* IBM PC는 OEM 문자집합을 고안했을때, 이 문자집합은 유럽 언어를 위한 몇몇 강조 문자와 수평, 수직, 귀퉁이를 비롯한 각종 선 그리기 문자를 제공했기 때문에, 화면에 그럴싸한 상자를 그리는 데 이런 문자를 사용할 수 있었습니다. -생략- 온갖 OEM 문자 집합 형식이 꿈틀거리며 기억 나오기 시작했으며, 각자 용도에 맞춰 128글자를 정의했습니다.-p45
* 반면에 아시아에서는 사람을 환장하게 만드는 여러 가지 요소를 고려해야만 합니다. 즉 아시아 문자집합이 결코 8비트에 들어갈 수 없는 수천가지 글자로 이뤄져 있다는 사실입니다. 이런 문제점은 일반적으로 DBCS(Double Bytes Character Set)로 부르는 두 바이트 문자 집합 시스템으로 해결합니다. -p46
* U+0645 윈도우 2000/XP에서 charmap 유틸리티를 사용하거나 유니코드 웹사이트를 방문해서 각 글자마다 할당된 유니코드 코드 포인트를 확인할 수 있습니다. -p49
* http://www.unicode.org
Posted by iarchitect