分享一段源码挖掘IMDb电影信息

Python能抓取网页上的信息,当然bash也可以,今天小编就拿bash脚本来挖掘IMDb中的电影信息噢!!挺好玩的!!!

我们是做教育的,希望大家能够学到知识,这个一直是我们的初衷!!

电影网站,这个网站我自己登入上去看了看,确实可以登入,并不需要挂vpn,可惜的是英文。

因为代码太长了,我分屏了一下,大伙可以看行号码,不过我会把源码分享出去。

代码里用到了大量的sed和grep,这个sed我之前有分享,改天找个机会说说grep的使用。

写好了运行一下吧,在脚本后面lawrenceofarabia是电影的名字。

你看吧!出来一系列的电影了!当然你的英文要好!!

那我现在就分享一下代码吧!!

Date2019-09-17PATH=/bin:/sbin:/usr/sbin:/usr/local/bin:/usr/local/sbin:~/binexportPATHtitleurl=""imdburl=";exact=trueref_=fn_tt_exq="tempout="/tmp/moviedata.$"summarize_film(){grep"title"$tempout|sed's/[^]*//g;s/(more)//'grep--color=never-A2'h5Plot:'$tempout|tail-1|\cut-d\-f1|fmt|sed's/^//'exit0}trap"rm-f$tempout"0115if[$-eq1-a-z"$nodigits"];thenlynx-source"$titleurl$1/combined"$tempoutsummarize_filmexit0fifixedname="$(echo$@|tr'''+')"url="$imdburl$fixedname"lynx-source$imdburl$fixedname$tempoutfail="$(grep--color--color=never'h1class="findHeader"No'$tempout)"if[!-z"$fail"];thenecho"Failed:noresultsfounfor$1"exit1elif[!-z"$(grep'h1class="findHeader"Displaying'$tempout)"];thengrep--color=never'/title/tt'$tempout|\sed's//\/g'|\grep-vE'(.png|.jpg|[]*$)'|\grep-A1"ahref="|\grep-v'^--

版权声明:本站所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,不声明或保证其内容的正确性,如发现本站有涉嫌抄袭侵权/违法违规的内容。请举报,一经查实,本站将立刻删除。

相关推荐