sort u is awesome

今天需要做一件比较蠢low的事情。从apache的access log中整理出包含某path的request的所有referer。
要找出referer不难。 cat + awk 基本搞定了。

比如对于类似192.168.0.101 - - [12/May/2014:20:41:48 +0900] "GET /index.html HTTP/1.1" 200 114 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:29.0) Gecko/20100101 Firefox/29.0" 的log,我们只需要

1
cat access_log_* | awk '$7~/keywords/{print $11}' > referer.txt

但对于一个日PV几百万的服务来说,显然这样整理出来的referer会有几十万条。其中包含了无数的重复。那么我们肿么去掉这些重复呢?
用vim是正解。

command mode下,:sort u

世界瞬间变得清爽。
用了这么久的vim,现在还能感受到vim的博大精深啊。

Vim
font-size: 14px; color: #808080">Userscript Vim Vue WatchOS Web Webpush activeadmin apache awk bash bash zsh shell bitcoin chrome curl docker encoding ffmpeg golang gorm headless hexo html httpd iptables ipv6 irkit javascript jq k8s leetCode leetcode lets encrypt lets_encrypt markdown nginx oauth2 osx php php73 postfix pushover ransack rke saslauthd strategy swift tls tty ufw vim vue watchos web3 webServer webpack webserver wechat wireshark yii 信用卡 刷题 家计 密码学 工具 归化 微信 微信小程序 投资指南 日本生活 日本留学 日籍 智能家电 暑假作业 Curl Osascript 树莓派 生活 算法 自宅サーバー 虚拟货币 随笔 小说 面试 드라마