从 amazon 抓高清图

写书评找封面图时,
鲜有直接用卓越上的小图。
这天准备写丹·布朗的《骗局》,
由于是再版的书,
而网上能找到的大图全是旧版的。

/亚马逊的产品图点开之后,
是一个小窗口式的工具。
仅显示分辨率 400 x 400px 左右的整体预览图,
点击之后再显示局部放大图片。

我们可以看到,
局部放大的图片是非常清晰的,
甚至有三级放大效果,
但并没有提供完整高清图的浏览。

通过查看源代码,
发现整体预览图的 URL 为:
http://g-ec4.images-amazon.com/images/P/B00292AUVG.01._SX301_SCLZZZZZZZ_V217771600_.jpg
对这个地址进行分析:
1、“g-ec4”可以变换为“g-ec1”等其他前缀,
不影响图片效果,估计是用于区分亚马逊产品地域;
2、“image”自然是指图片,“P”大概是指“Product”(产品);
3、“B00292AUVG”为产品唯一编码;
4、“01”可以改为“02”等,不影响图片效果;
5、“SX301”与该缩略图宽度 301px 相等,
改变该数字最大可以得到分辨率不超过 500 x 500px 的图,
向我们的目标近了一步;
6、“SCLZZZZZZZ”中“SCL”大概是“scale”(尺寸)的缩写,
修改该参数为不少于两个字母时,
可以得到分辨率不超过 160 x 160px 的图。
7、“V217771600”大概是产品的第二个编码。

再查看局部放大的图的 URL:
http://g-ec5.images-amazon.com/R/1/a=B00292AUVG+d=_SCR(3,2,2)_+o=01+s=RMTILE+va=MAIN+ve=217771600+e=.jpg
1、“R”大概代表“Resize”(缩放)。
2、“a=B00292AUVG”依旧表明了产品编号,
“a”可能是“attribute”(属性)。
3、“d=_SCR(3,2,2)_”比较有意思,
“d”大概是“dimention”(维度)、
“SCR”应该是“screen”(屏幕),
后面三个数字代表了显示在“屏幕”上的图片“维度”。
第一个数字代表缩放尺寸,“0”无缩放,“3”最大,
第二个数字代表局部图片所在的横轴,从左至右从“0”开始,
第三个数字代表局部图片所在的纵轴,从上至下从“0”开始,
当该参数表达不正确时,
默认返回最大分辨率 600 x 600px 的图,
再一次接近了我们的目标;
4、“o=01”如此前一样可修改为“02”而不影响图片效果;
5、“s=RMTILE”中“TILE”(网格),
大约与局部图片排列方式有一定关系;
6、“va=MAIN”的“MAIN”(主要)是指产品的主要图片,
当产品多于一个图片时,
会以“PT01”、“PT02”的形式出现;
7、“ve=217771600”如此前一样可能是产品附加编码。

这么一来,似乎已经走进了死胡同,
就在我已经几乎要放弃的时候,
我发现其实网上也有很多朋友在关注这个问题,
在某篇帖子中提到可以利用 Firefox 的 PictureFox 插件
查看亚马逊的高清产品图。

这其实是一个 Chrome
它在美国、英国亚马逊产品预览图上增加了一个小图标,
点击之后会展开一个页面:
://picturefox/content/gallery.html
该页面以图库的形式将产品全部图片列出,
并可以查看高清图的形式。

通过查看源代码,
发现插件并不是将局部图拼成大图,
而是直接引用了高清图源!
以下是某个随机产品的高清图地址:
http://z2-ec2.images-amazon.com/images/P/B000EOPQ7E.01.MAIN._SCRMZZZZZZ_.jpg
这个地址形式接近前面 400 x 400 预览图地址:
http://g-ec4.images-amazon.com/images/P/B00292AUVG.01._SX301_SCLZZZZZZZ_V217771600_.jpg
于是尝试将预览图地址中的“.01.”后的部分,
替换成“MAIN._SCRMZZZZZZ_.jpg”,得到:
http://g-ec4.images-amazon.com/images/P/B00292AUVG.01.MAIN._SCRMZZZZZZ_.jpg
Bingo!高清图入手!

【相关资料】
1、Amazon HD Image Finder◃horan.cc
2、亚马逊局部图分析◃playskill
3、亚马逊图片讨论◃albumartexchange
4、PictureFox◃mozilla
5、亚马逊图片格式详尽解释:Nat Gertler – Abusing Amazon images◃aaugh
6、亚马逊图片 JS 生成器:Byrne – Javascript Amazon Image Hacking◃majordojo

2 个回应

  1. Samanosuke 2012年01月30日 / 16:23

    厲害厲害, 我搞了半小時也查不到

    • horan 2012年01月31日 / 20:10

      在下已经写了个查找器,方便直接抓图,请搜。

horan进行回复 取消回复

邮箱地址不会被公开。 必填项已用*标注