한동안 포스팅을 하지 못하였네요. 이리저리 꼬인일들이 많아서...
핑계아닌 핑계로 보이지만 바쁜건 사실이었습니다. -_-

이전의 포스트를 보면 매쉬업 경진대회에 많은 관심을 가지고 있음을 아실 수 있으실 것입니다. 매쉬업 경진대회를 출품하려고 이리저리 생각도 많이 해보고 테스트 프로그램도 만들어 본 결과 매쉬업 경진대회는 포기하여야 겠습니다.
저는 책 검색 관련 매쉬업 서비스를 만들어 보려고 준비중이었습니다.
우리나라에 나와있는 책검색관련 매쉬업서비스는 NAVER, DAUM, ALADDIN 정도가 되겠군요. 이 세개의 책검색을 매쉬업하는 서비스를 개발하려고 하였습니다.

서비스를 위해 부분테스팅을 하는 동안 몇개의 문제점이 생겼습니다.

첫째, 세개의 서비스가 제공하는 검색결과 데이터 매핑 문제입니다.
세개의 서비스가 제공하는 검색결과는 다른 것이 당연한 것입니다. 하지만 실제로 존재하는 책은 한권임에 불구하고 어느 한 서비스를 기준으로 하는 검색 서비스를 개발할 경우 ISBN을 기준으로 데이터를 매칭하는 문제가 있습니다. 다음과 네이버는 일일 검색 수를 5000회로 한정하고 있으며 때문에 ISBN을 이용하여 데이터를 매칭할 경우 서버의 과부하를 주거나 또는 해당 서비스의 많은 호출을 해야한다는 단점이 있을 수 있습니다.

둘째, 실제로 책을 사기 위해 검색할때는 본문 내용을 참고하는 경우가 많습니다만 OPEN API에서는 현재 이것을 제공하여 주지 않습니다.
세개의 서비스 모두 책의 상세 정보를 보기 위해선 제공하는 링크를 따라 새로운 웹페이지를 열고 책의 내용을 확인하여야 합니다. 다음,네이버,알라딘등의 서비스 제공업체에서는 CP와의 문제로 데이터를 제공하여 줄 수 없는 것 같습니다. 검색결과를 찾았음에도 불구하고 해당 링크로 넘어가야 제대로 된 데이터를 구경할 수 있다는 것은 사탕발림이나 다름없다고 생각합니다. 요만큼 보여주고 다른싸이트 가서 봐라 하는 서비스는 실용적일 수 없다고 생각합니다. 물론 익스플로어와 같은 브라우져에서 레이어를 이용하여 새 창을 열지않고 페이지 위에 보여줄 수 있긴 하지만 그러한 정보로 사용자를 이끌기엔 부족한 것 같습니다.

셋째, 서비스 업체의 데이터 신뢰도 문제입니다.
데이터검색 테스트를 하는 도중에 발견한 문제입니다. 저는 도시정벌이라는 만화책을 매우 좋아해서 도시정벌로 데이터를 검색하여 보았습니다. 네이버나 알라딘은 최신에 발행한 도시정벌 6부 58권까지 데이터가 검색이 되었습니다. 하지만 이 글을 쓰는 현시점에서 다음은 해당 도서를 검색하지 못하였습니다. (다음은 최신작이 2005년 5월 12일에 발행된 6부 23권이 최신작으로 나옵니다. -_-) 어찌됫는 이 문제는 데이터 매핑문제에 해당되는 것이니 더이상 거론하지 않겠습니다. 하지만 더욱더 신기한 문제가 있습니다.
사용자 삽입 이미지

알라딘과 네이버의 ISBN 비교

사용자 삽입 이미지

네이버간의 ISBN 번호 차이

위의 그림을 보시면 같은 책임에도 불구하고 ISBN번호가 다른 것을 알 수 있습니다. 저도 이부분에서 정말 당황했습니다. 같은 책임에도 불구하고 ISBN의 번호가 다르게 표기가 되었다는 사실에 ...-_-
 하지만 이부분은 검색하여 보니 알라딘의 오류로 판명이 되었습니다.
한국문헌번호센터에 따르면 2007년 1월 1일부터는 ISBN번호는 13자리를 따라야 한다고 공지하고 있습니다. [관련링크]

ISBN의 바코드 구분 번호인 978을 제외하면 1번 그림과 같이 코드자리수는 동일하게 됩니다. 하지만 마지막자리수가 틀린 것을 볼 수가 있습니다. 이 이유는 바로 check digit 문제입니다.
결국 두 회사모두 ISBN의 번호는 맞는 것으로 판명되었습니다. 하지만 알라딘에서는 국립중앙도서관 문헌번호센터의 룰을 따르지 않는 것으로 생각이 드는군요. 아니면 아직 시스템을 개발하고 있는 중인지도 모르겠습니다. -_-;;

아무리 그래도 출판사에서 책을 출판할때 ISBN 번호를 찍어서 출간하는데 왜 이러한 일이 발생하였는지는 의구심이 밀려들어 옵니다. 책에 표기된 ISBN번호는 동일할 것으로 생각되는데 말입니다.

이러한 이유들로 현재 서비스 개발을 할까 말까 심히 고려중입니다. ISBN번호를 매칭하는 프로그램은 쉽게 짤 수 있을 것 같지만 매핑문제에 따라 이러한 질문이 나올 수 있기 때문이죠.

"자신이 개발한 서비스가 기존의 네이버,다음,알라딘의 서비스보다 낫다고 하는 점을 말씀해보세요"

위의 질문에 점점 자신이 없어져 갑니다. 기존의 저의 개념은 책검색을 통합화 하여 많은 데이터를 보여주고 또한 트랙백같은 기능을 이용하여 실제 블로거분들의 책에 대한 후기들을 등록하는 방식으로 서비스를 개발하려고 하였었습니다. 위의 질문은 제가 자바공모전 본선에서 들어본 질문이라 더욱더 대답하기가 힘들어 지는 군요 (저러한 질문덕에 본선에서 입상하지 못하였던 기억이 -_-;;)

다음 포스팅은 ISBN관련 소스를 만들어 공개할 예정입니다. ^^

크리에이티브 커먼즈 라이선스
Creative Commons License