awk常用命令及功能

2025-05-25

AWK 是一种强大的文本处理工具，常用在 Unix/Linux 环境中处理和分析结构化数据。以下是 AWK 的常用命令和功能，简要总结：

基本语法

1	awk [选项] '模式 {动作}' 文件

模式：指定匹配条件（如正则表达式或逻辑条件）。
动作：对匹配的行执行的操作（如打印、计算）。
文件：输入文件，若无文件，可从标准输入读取。

常用选项

-F：指定字段分隔符（默认是空格或制表符）。

1	awk -F: '{print $1}' /etc/passwd # 以冒号分隔，打印第一列

-v：定义变量。

1	awk -v var=5 '{print $1 * var}' file.txt # 使用变量 var

常用内置变量

FS：输入字段分隔符（默认空格）。
OFS：输出字段分隔符（默认空格）。
NR：当前处理的记录（行）号。
NF：当前行的字段数。
$0：整行内容。
$n：第 n 个字段（从 1 开始）。

常用命令和模式

打印整行或特定字段

1 2	awk '{print $0}' file.txt # 打印整行 awk '{print $1, $3}' file.txt # 打印第 1 和第 3 字段

条件匹配

1 2	awk '/pattern/ {print $0}' file.txt # 打印包含 pattern 的行 awk '$1 == "value" {print $2}' file.txt # 第一字段为 value 时打印第二字段

指定行号

1 2	awk 'NR==5 {print $0}' file.txt # 打印第 5 行 awk 'NR>=2 && NR<=5 {print $0}' file.txt # 打印第 2 到第 5 行

统计行数或字段

1 2	awk 'END {print NR}' file.txt # 统计总行数 awk '{print NF}' file.txt # 每行字段数

计算（求和、平均值等）

1 2	awk '{sum += $1} END {print sum}' file.txt # 计算第一列总和 awk '{sum += $1; count++} END {print sum/count}' file.txt # 计算第一列平均值

格式化输出

1	awk '{printf "%-10s %s\n", $1, $2}' file.txt # 格式化输出第 1、2 字段

处理多文件

1	awk '{print FILENAME, $0}' file1.txt file2.txt # 打印文件名和内容

BEGIN 和 END 块
- BEGIN：在处理文件前执行。
- END：在处理文件后执行。
  1
  awk 'BEGIN {print "Start"} {print $1} END {print "End"}' file.txt

常用示例

提取日志中特定列

1	awk -F' ' '{print $1, $3}' access.log # 提取日志第 1 和第 3 列

统计文件中某值出现次数

1	awk '$1 == "error" {count++} END {print count}' log.txt # 统计 error 出现次数

替换字段

1	awk '{sub("old", "new", $1); print $0}' file.txt # 将第一字段中的 old 替换为 new

处理 CSV 文件

1	awk -F',' '{print $1, $2}' data.csv # 处理逗号分隔的 CSV 文件

注意事项

AWK 脚本可以保存为文件，使用 -f 选项调用：
1
awk -f script.awk file.txt
AWK 支持正则表达式、循环、条件语句，适合复杂数据处理。
对于大数据量，AWK 比 sed 或 grep 更高效，尤其在字段操作上。

如果需要更详细的 AWK 教程或特定用例，请告诉我！

展开全文 >>

istio 配置

2024-05-29

Istio 服务网格
Istio 使用功能强大的 Envoy 服务代理扩展了 Kubernetes，以建立一个可编程的、可感知的应用程序网络。 Istio 与 Kubernetes 和传统工作负载一起使用，为复杂的部署带来了标准的通用流量管理、遥测和安全性。

安装

1	curl -L https://istio.io/downloadIstio \| sh -

真实 ip 转发

生成环境不建议

1	kubectl patch svc istio-ingressgateway -n istio-system -p '{"spec":{"externalTrafficPolicy":"Local"}}'

HTTP/HTTPS 负载均衡

apiVersion: install.istio.io/v1alpha1
kind: IstioOperator
spec:
  meshConfig:
    defaultConfig:
      gatewayTopology:
        numTrustedProxies: 2

通过负载均衡器, 添加 ip 转发头
以 nginx 为例

map $http_upgrade $connection_upgrade {
    default upgrade;
    ''      close;
}

server {
	listen 80 default_server;
	listen [::]:80 default_server;

	server_name _;

	location / {
                proxy_http_version 1.1;
                proxy_set_header Upgrade $http_upgrade;
                proxy_set_header Connection "upgrade";
                proxy_set_header Host $host;
                proxy_set_header X-Forwarded-For  $proxy_add_x_forwarded_for;
                proxy_set_header X-Real-IP $remote_addr;
                proxy_pass http://192.168.3.161;
        }
}

展开全文 >>

k8s 节点控制

2024-05-29

在 Kubernetes 中，节点分为两种，一种是普通节点，一种是控制平面（control-plane）节点

控制平面组件包括 kube-apiserver、kube-controller-manager、kube-scheduler、etcd，是由来支撑平台运行的组件，在集群部署完成时即运行在所有的控制节点上。
node 节点组件在每个节点上运行，维护运行的 Pod 并提供 Kubernetes 运行环境，

etcd

etcd 是兼具一致性和高可用性的键值数据库，是用来保存 Kubernetes 所有集群数据的后台数据库。在生产环境中，为了保证高可用性，一般将 etcd 部署在多个节点上组成集群。

kube-apiserver

apiserver 是控制面的前端，对所有资源的操作都要经过 apiserver，apiserver 是无状态的，可以横型扩展，用 Haproxy 或者负载均衡器让多个 apiserver 协同工作。

kube-scheduler

scheduler 负责监视新创建的、未指定运行节点（node）的 Pods，选择节点让 Pod 在上面运行。调度决策考虑的因素包括单个 Pod 和 Pod 集合的资源需求、硬件/软件/策略约束、亲和性和反亲和性规范、数据位置、工作负载间的干扰和最后时限。

kube-controller-manager

controller-manager 是一系列控制器的集合，这些控制器在逻辑上属于不同的进程，但为了降低复杂性将这些控制器编译在了同一个可执行文件中，控制器包括：

节点控制器（Node Controller）: 负责在节点出现故障时进行通知和响应
任务控制器（Job controller）: 监测代表一次性任务的 Job 对象，然后创建 Pods 来运行这些任务直至完成
端点控制器（Endpoints Controller）: 填充端点(Endpoints)对象(即加入 Service 与 Pod)
服务帐户和令牌控制器（Service Account & Token Controllers）: 为新的命名空间创建默认帐户和 API 访问令牌
以及其他比如 Pod 管理的 Replication 控制器、Deployment 控制器等数十种类型 API 对象的控制器。

kube-proxy

kube-proxy 是集群中每个节点上运行的网络代理，是实现 Kubernetes 服务（Service）概念的一部分。
kube-proxy 维护节点上的网络规则。这些网络规则允许从集群内部或外部的网络会话与 Pod 进行网络通信。
kube-proxy 有两种模式实现流量转发，分别是 iptables 模式和 ipvs(IP Virtual Server)模式，默认是 iptables 模式，是通过每个节点的 iptables 规则实现的，但随着 service 数量增大，iptables 模式由于线性查找匹配、全量更新等特点，性能会显著下降，因此从 Kubernetes 的 1.8 版本开始引入了 ipvs 模式，ipvs 和 iptables 都是基于 netfilter，但 ipvs 使用 hash 表并且运行在内核态，可以显著提升性能。

kubelet

kubelet 是一个在集群中每个节点（node）上运行的代理，负责接收并处理控制节点发来的指令，以及管理当前 node 上 pod 对象的容器，它保证容器（containers）都运行在 Pod 中。
kubelet 接收一组通过各类机制提供给它的 PodSpecs，确保这些 PodSpecs 中描述的容器处于运行状态且健康。
kubelet 不会管理不是由 Kubernetes 创建的容器。
kubelet 支持从 API server 以配置清单形式接收资源定义，或者从指定的目录加载静态 pod 配置清单，通过容器运行时创建、启动和监事容器。

普通节点加入

1	kubeadm join <master-ip>:<master-port> --token <your-token> --discovery-token-ca-cert-hash sha256:<your-hash>

控制平面节点加入

1	kubeadm join <master-ip>:<master-port> --token <your-token> --discovery-token-ca-cert-hash sha256:<your-hash> --control-plane --certificate-key <your-certificate-key>

获取 token

kubeadm token list
## 获取hash
openssl x509 -pubkey -in /etc/kubernetes/pki/ca.crt | openssl rsa -pubin -outform der 2>/dev/null | openssl dgst -sha256 -hex | sed 's/^.* //'

## 生成新的证书
kubeadm init phase upload-certs --upload-certs

# 完整命令打印
sudo kubeadm token create --print-join-command --certificate-key $(kubeadm certs certificate-key)  # 如果无效，请使用上述命令重新上传证书

展开全文 >>

dns 私有服务器

2024-05-13

DNS 服务器是(Domain Name System 或者 Domain Name Service)域名系统或者域名服务,域名系统为 Internet 上的主机分配域名地址和 IP 地址。
公司内部通过域名访问内部服务器，但是域名解析又无法访问到内网，所以内部 dns 解析服务是最好的解决方案

more >>

展开全文 >>

SeaFile 网盘

2024-05-11

Seafile 是一款开源的企业云盘，注重可靠性和性能，支持全平台客户端。Seafile 内置协同文档 SeaDoc ，让协作撰写、管理和发布文档更便捷。
Seafile 提供全面的网盘功能，用户可以在 Seafile 中存储、管理和共享文件。支持多种文件类型。支持全平台客户端，包括 Windows、Mac、Linux、iOS、Android 多种操作系统以及移动设备，可以在任何设备上轻松访问和管理文件，体验更为统一。
Seafile 的协作功能超越了简单的文件共享。它支持多人协同在线编辑、文档编辑锁定，同时提供权限管理、版本控制和事件通知等功能，使得团队协作更加流畅、可控和高效。

(官网)[https://www.seafile.com/]

more >>

展开全文 >>

golang 私有包

2024-05-10

RUN go env -w GOPRIVATE="gitlabIp"
RUN go env -w GONOPROXY="gitlabIp"
RUN go env -w GOINSECURE="gitlabIp"
RUN go env -w GONOSUMDB="gitlabIp"

展开全文 >>

verdaccio 前端私有源

2024-05-10

我们平时使用 npm publish 进行发布时，上传的仓库默认地址是 npm，公司内部包的管理并不希望发布到公网去，所以需要发布到自己的私有仓库，之前都是用的 cnpmjs, 由于没有维护了，太老了，所以改用 Verdaccio。通过 Verdaccio 工具在本地新建一个仓库地址，再把本地的默认上传仓库地址切换到本地仓库地址即可。当 npm install 时没有找到本地的仓库，则 Verdaccio 默认配置中会从 npm 中央仓库下载。

more >>