Logstash 解析日志

Logstash 使用输入插件接收日志，然后使用过滤插件来解析和转换数据。日志的解析和转换是根据输出目的地中存在的系统执行的。 Logstash 解析日志数据并仅转发必填字段。之后，这些字段被转化为目标系统兼容且可理解的形式。

如何解析日志？

我使用 GROK（知识图形表示）模式对日志进行解析，可以在 Github 中找到它们-

https://github.com/elastic/logstash/tree/v1.4.2/patterns.

Logstash 将日志数据与指定的 GROK Pattern 或 Pattern 序列匹配，用于解析日志，如"%{COMBINEDAPACHELOG}"，通常用于 apache 日志。

解析后的数据更加结构化，更易于搜索和执行查询。 Logstash 在输入日志中搜索指定的 GROK 模式并从日志中提取匹配的行。可以使用 GROK 调试器来测试的 GROK 模式。

GROK 模式的语法是 %{SYNTAX:SEMANTIC}。 Logstash GROK 过滤器采用以下形式编写-

%{PATTERN:FieldName}

这里，PATTERN 代表 GROK 模式，fieldname 是字段的名称，代表输出中解析的数据。

例如，使用在线 GROK 调试器 https://grokdebug.herokuapp.com/

输入

日志中的示例错误行-

[Wed Dec 07 21:54:54.048805 2016] [:error] [pid 1234:tid 3456829102]
   [client 192.168.1.1:25007] JSP Notice:  Undefined index: abc in
   /home/manu/tpworks/lidihuo.com/index.jsp on line 11

GROK 模式序列

此 GROK 模式序列与日志事件匹配，其中包含时间戳，后跟日志级别、进程 ID、事务 ID 和错误消息。

\[(%{DAY:day} %{MONTH:month} %{MONTHDAY} %{TIME} %{YEAR})\] \[.*:%{LOGLEVEL:loglevel}\]
   \[pid %{NUMBER:pid}:tid %{NUMBER:tid}\] \[client %{IP:clientip}:.*\]
   %{GREEDYDATA:errormsg}

输出

输出为 JSON 格式。

{
   "day": [
      "Wed"
   ],
   "month": [
      "Dec"
   ],
   "loglevel": [
      "error"
   ],
   "pid": [
      "1234"
   ],
   "tid": [
      "3456829102"
   ],
   "clientip": [
      "192.168.1.1"
   ],
   "errormsg": [
      "JSP Notice:  Undefined index: abc in
      /home/manu/tpworks/lidihuo.com/index.jsp on line 11"
   ]
}

找工作要求35岁以下，35岁以上的程序员都干什么去了？

长久以来，一直有一个问题困扰着技术人——如何打破“程序员的35岁职业魔咒”，这一天迟早会到来，或早或晚。

或许是选错了行业，程序员薪水虽高，但光鲜的外表下，背后的苦衷只有自己知道。三十多岁本该是一个人事业的黄金期，但技术变化日新月异，行业竞争异常残酷，对一个企业来说，永远有比你更年轻、劳动成本更低的人可以选择，这让你的中年危机提前到来。破局的智慧可以看看这本书！>>

<< Logstash 输入 Logstash 过滤器 >>

昵称：邮箱：