XUNGE's Blog

LXD报错：Error LXD unix socket not accessible Get "http://unix.socket/1.0" EOF

2024-04-22T11:42:12.000Z

最近重启了下服务器，结果LXD的容器全部无法启动，差点没给我整崩溃了。。。

查看容器命令报以下错误：

$ sudo lxc list
Error: LXD unix socket not accessible: Get "http://unix.socket/1.0": EOF

因为只是进行了重启，没有进行其他操作，所以怀疑是ZFS存储有问题，毕竟有两块是机械硬盘，于是查看zpool的状态：

$ sudo zpool status -v
  pool: lxd
 state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
entire pool from backup.
   see: http://zfsonlinux.org/msg/ZFS-8000-8A
  scan: scrub repaired 0B in 9h3m with 1 errors on Sun Apr 14 09:27:53 2024
config:

NAME                                      STATE     READ WRITE CKSUM
lxd                                       ONLINE       0     0     0
  /var/snap/lxd/common/lxd/disks/lxd.img  ONLINE       0     0     0

errors: Permanent errors have been detected in the following files:

        lxd/containers/amr:/rootfs/home/amr/Data/manipulated_sequences/Deepfakes/c40/videos/DF_C40/41756.png

果然zpool报错，显示某个容器下的某一个路径的图片损坏。先把整个镜像lxd.img整体备份，怕到时候丢东西。还好只有3TB，NAS能装下。

还好，问题不大，上网查找说ZFS有自动扫描并恢复的命令。

尝试运行了两遍sudo zpool scrub和sudo zpool clear，每次长达9小时的校验后问题并没有解决，于是只好手动删除受损文件。

将对应的容器挂载到/mnt，然后进入对应的目录，手动删除受损文件，为了方便，使用root用户，具体命令如下：

$ sudo mount -t zfs lxd/containers/amr /mnt

$ su
$ cd /mnt/rootfs/home/amr/Data/manipulated_sequences/Deepfakes/c40/videos/DF_C40/
$ rm -f 41756.png
$ exit

$ sudo umount /mnt

此时查看zpool状态报错信息如下：

$ sudo zpool status -v
  pool: lxd
 state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption.  Applications may be affected.
action: Restore the file in question if possible.  Otherwise restore the
entire pool from backup.
   see: http://zfsonlinux.org/msg/ZFS-8000-8A
  scan: scrub repaired 0B in 8h50m with 1 errors on Sat Apr 20 04:36:35 2024
config:

NAME                                      STATE     READ WRITE CKSUM
lxd                                       ONLINE       0     0     0
  /var/snap/lxd/common/lxd/disks/lxd.img  ONLINE       0     0     4

errors: Permanent errors have been detected in the following files:

        lxd/containers/amr:<0x1ea187>

再次执行sudo zpool scrub：

$ sudo zpool status -v
  pool: lxd
 state: ONLINE
status: One or more devices has experienced an unrecoverable error.  An
attempt was made to correct the error.  Applications are unaffected.
action: Determine if the device needs to be replaced, and clear the errors
using 'zpool clear' or replace the device with 'zpool replace'.
   see: http://zfsonlinux.org/msg/ZFS-8000-9P
  scan: scrub repaired 0B in 9h20m with 0 errors on Sat Apr 20 19:52:37 2024
config:

NAME                                      STATE     READ WRITE CKSUM
lxd                                       ONLINE       0     0     0
  /var/snap/lxd/common/lxd/disks/lxd.img  ONLINE       0     0     4

errors: No known data errors

显示错误貌似消失了，但是还是让执行sudo zpool clear：

$ sudo zpool status -v
  pool: lxd
 state: ONLINE
  scan: scrub repaired 0B in 9h17m with 0 errors on Sun Apr 21 05:41:04 2024
config:

NAME                                      STATE     READ WRITE CKSUM
lxd                                       ONLINE       0     0     0
  /var/snap/lxd/common/lxd/disks/lxd.img  ONLINE       0     0     0

errors: No known data errors

至此，LXD使用的ZFS文件系统已经没有问题了，但是执行sudo lxc list还是会报错：

Error: LXD unix socket "/var/snap/lxd/common/lxd/unix.socket" not accessible: Get "http://unix.socket/1.0": dial unix /var/snap/lxd/common/lxd/unix.socket: connect: resource temporarily unavailable

查看lxd的调试信息如下：

$ sudo lxd --debug --group lxd
DEBUG  [2024-04-21T08:08:14+08:00] Connecting to a local LXD over a Unix socket
DEBUG  [2024-04-21T08:08:14+08:00] Sending request to LXD                        etag= method=GET url="http://unix.socket/1.0"
INFO   [2024-04-21T08:08:14+08:00] LXD is starting                               mode=normal path=/var/snap/lxd/common/lxd version=5.21.1
INFO   [2024-04-21T08:08:14+08:00] Kernel uid/gid map:
INFO   [2024-04-21T08:08:14+08:00]  - u 0 0 4294967295
INFO   [2024-04-21T08:08:14+08:00]  - g 0 0 4294967295
INFO   [2024-04-21T08:08:14+08:00] Configured LXD uid/gid map:
INFO   [2024-04-21T08:08:14+08:00]  - u 0 1000000 1000000000
INFO   [2024-04-21T08:08:14+08:00]  - g 0 1000000 1000000000
INFO   [2024-04-21T08:08:14+08:00] Kernel features:
INFO   [2024-04-21T08:08:14+08:00]  - closing multiple file descriptors efficiently: no
INFO   [2024-04-21T08:08:14+08:00]  - netnsid-based network retrieval: yes
INFO   [2024-04-21T08:08:14+08:00]  - pidfds: no
INFO   [2024-04-21T08:08:14+08:00]  - core scheduling: no
INFO   [2024-04-21T08:08:14+08:00]  - uevent injection: yes
INFO   [2024-04-21T08:08:14+08:00]  - seccomp listener: yes
INFO   [2024-04-21T08:08:14+08:00]  - seccomp listener continue syscalls: yes
INFO   [2024-04-21T08:08:14+08:00]  - seccomp listener add file descriptors: no
INFO   [2024-04-21T08:08:14+08:00]  - attach to namespaces via pidfds: no
INFO   [2024-04-21T08:08:14+08:00]  - safe native terminal allocation : yes
INFO   [2024-04-21T08:08:14+08:00]  - unprivileged file capabilities: yes
INFO   [2024-04-21T08:08:14+08:00]  - cgroup layout: hybrid
WARNING[2024-04-21T08:08:14+08:00]  - Couldn't find the CGroup blkio.weight, disk priority will be ignored
WARNING[2024-04-21T08:08:14+08:00]  - Couldn't find the CGroup memory swap accounting, swap limits will be ignored
INFO   [2024-04-21T08:08:14+08:00]  - idmapped mounts kernel support: no
INFO   [2024-04-21T08:08:14+08:00] Instance type operational                     driver=lxc features="map[]" type=container
ERROR  [2024-04-21T08:08:14+08:00] Unable to run feature checks during QEMU initialization: Unable to locate the file for firmware "OVMF_CODE.4MB.fd"
WARNING[2024-04-21T08:08:14+08:00] Instance type not operational                 driver=qemu err="QEMU failed to run feature checks" type=virtual-machine
INFO   [2024-04-21T08:08:14+08:00] Initializing local database
DEBUG  [2024-04-21T08:08:14+08:00] Refreshing identity cache with local trusted certificates
INFO   [2024-04-21T08:08:14+08:00] Set client certificate to server certificate  fingerprint=7bfa6d5710e943f5f23524bcca9f0a51bb5f58f819d1b9fb3e1d843facc0a20b
DEBUG  [2024-04-21T08:08:14+08:00] Initializing database gateway
INFO   [2024-04-21T08:08:14+08:00] Starting database node                        id=1 local=1 role=voter
ERROR  [2024-04-21T08:08:14+08:00] Failed to start the daemon                    err="Failed to start dqlite server: raft_start(): io: load closed segment 0000000000185550-0000000000185550: entries batch 45 starting at byte 487448: entries count in preamble is zero"
INFO   [2024-04-21T08:08:14+08:00] Starting shutdown sequence                    signal=interrupt
INFO   [2024-04-21T08:08:14+08:00] Not unmounting temporary filesystems (instances are still running)
INFO   [2024-04-21T08:08:14+08:00] Daemon stopped
Error: Failed to start dqlite server: raft_start(): io: load closed segment 0000000000185550-0000000000185550: entries batch 45 starting at byte 487448: entries count in preamble is zero

错误信息主要是 0000000000185550-0000000000185550 数据库io错误。

于是找到该数据库的路径为 /var/snap/lxd/common/lxd/database/global/。

删除该路径下的 0000000000185550-0000000000185550 以及该编号之后的所有数据库，删除之前需备份。

删除后执行 sudo lxc list 不报错了，但是所有容器都是stopped状态，并且无法开启。查看LXD存储状态报错：

$ sudo lxc storage list
Error: Required tool 'zpool' is missing

然而zpool是安装好的。

查看LXD的版本：

$ snap list lxd
Name  Version         Rev    Tracking     Publisher   Notes
lxd   5.21.1-98dad8f  28323  5.21/stable  canonical✓  -

发现已经是最新版本的5.21.1，于是尝试降级再升级：

$ sudo snap refresh lxd --channel=5.20/stable
$ sudo snap refresh lxd --channel=5.21/stable

这之后问题解决：

$ sudo lxc storage list
+------+--------+----------------------------------------+-------------+---------+---------+
| NAME | DRIVER |                 SOURCE                 | DESCRIPTION | USED BY |  STATE  |
+------+--------+----------------------------------------+-------------+---------+---------+
| lxd  | zfs    | /var/snap/lxd/common/lxd/disks/lxd.img |             | 30      | CREATED |
+------+--------+----------------------------------------+-------------+---------+---------+

所有容器都可以正常启动，几乎没有数据丢失。最后估计是LXD需要重新安装即可，我在降级后LXD调试报以下错误：

Error: Failed to initialize global database: failed to ensure schema: schema version '73' is more recent than expected '69'

估计是版本不对应，于是升级回来，发现错误就都解决了。

最后的总结就是，ZFS文件系统是个好东西，最好定期备份，并且硬盘做好冗余，尽量不要使用机械硬盘。

在此进行记录，希望能帮助到你~

参考： - Error: LXD unix socket “/var/snap/lxd/common/lxd/unix.socket” not accessible: Get “http://unix.socket/1.0”: dial unix /var/snap/lxd/common/lxd/unix.socket: connect: resource temporarily unavailable - Permanent errors have been detected in the following files: #9705 - Clear a permanent ZFS error in a healthy pool - Ubuntu 22.04, LXD 5.0.2 - “Required tool ‘zpool’ is missing” after apt upgrade

Zerotier 搭建 Moon 节点并支持动态 IP（DDNS）

2023-03-31T13:02:42.000Z

Zerotier 搭建 Moon 节点可以减少连接延迟，但是 Moon 节点只支持静态 IP，在国内大概率只有购买 VPS，但是国内 VPS 带宽很金贵，按流量付费又有些麻烦。如果家里宽带有公网 IP 的话是最好的，但是 Moon 节点又不支持动态 IP。

本文通过脚本命令获取当前公网 IP，并与 moon.json 中的 IP 进行比对，如果不一致，则更改 moon.json 中的 IP，并重启服务。

本文是在 openwrt 里安装的 Zerotier，luci-app-zerotier 插件自带的 Zerotier 服务。地址为 /etc/config/zero。

搭建 moon 节点

生成 moon.json

cd /etc/config/zero
zerotier-idtool initmoon identity.public > moon.json

修改刚刚生成的配置文件 moon.json 中的 stableEndpoints：

{
 "id": "xxxxx",
 "objtype": "world",
 "roots": [
  {
   "identity": "xxxx:0:eeee",
   "stableEndpoints": ["10.10.0.0/9993"]
  }
 ],
 "signingKey": "asdfasdfasdf",
 "signingKey_SECRET": "asdfasdfasdfasd",
 "updatesMustBeSignedBy": "asdfasdfasdf",
 "worldType": "moon"
}

此处的 10.10.0.0 就是公网 IP。

生成签名文件

zerotier-idtool genmoon moon.json

执行之后会生产一个 000000xxxx.moon 的文件

新建 moons.d 文件夹，将生成的 .moon 文件移动到 moons.d 文件夹中，并重启 Zerotier 服务

mkdir moons.d
mv *.moon moons.d/
/etc/init.d/zerotier restart

自动更新 Moon 节点 IP

将以下脚本放到 /etc/config/zero/update_moon.sh 中

#!/bin/bash
# Set the path to the moon.json file
MOON_JSON_PATH=/etc/config/zero/moon.json

# Get the current public IP address
CURRENT_IP=$(curl -4s https://checkip.amazonaws.com)
echo "Current IP address is: $CURRENT_IP"

# Get the IP address in the moon.json file
MOON_IP=$(jq -r '.roots[0].stableEndpoints[0] | split("/")[0]' $MOON_JSON_PATH)
echo "Moon IP address is: $MOON_IP"

# Check if the IP address has changed
if [ "$CURRENT_IP" != "$MOON_IP" ]; then
  echo "IP is different."
  # Update the IP address in moon.json
  sed -i 's/[0-9]\+\.[0-9]\+\.[0-9]\+\.[0-9]\+/'"$CURRENT_IP"'/g' moon.json

  # Generate the sign file
  zerotier-idtool genmoon moon.json

  # Delete exsist sign file
  rm -f moons.d/*.moon

  # Move exsist sign file
  mv *.moon moons.d/

  # Restart the zerotier service to apply the changes
  /etc/init.d/zerotier restart
  echo "Zerotier service restart."
fi
echo "IP is same."

使用crontab来定时执行脚本，输入以下命令来编辑当前用户的crontab文件：

crontab -e

然后在打开的编辑器中添加一行如下的内容，表示每天凌晨2点执行update_moon.sh脚本：

0 2 * * * /etc/config/zero/update_moon.sh

保存并退出编辑器。这会将指定的命令添加到用户的crontab中，使其每天凌晨2点自动执行。

完整步骤！如何使用LXD构建多人使用GPU服务器

2022-07-14T12:08:42.000Z

最近深度学习仍然爆火，多人如何优雅地使用 GPU 服务器仍然是值得探讨的问题。

对于单个服务器来说，LXD 仍然是我认为最舒服的多人共用服务器的方式。他避免了权限滥用，能够完整利用硬件，缺点就是显卡驱动需要保持一致，升级较为麻烦。

本教程超级详细，是根据我最近操作录屏总结的最佳步骤，并且为批量操作总结了脚本，保证你能够顺利完成安装。

格式化硬盘

由于 LXD 的容器需要使用 ZFS 文件系统进行管理，因此有两种对硬盘的格式化方式：

所有硬盘作为宿主机系统盘。在 LXD 初始化时创建新的 ZFS 镜像，其占用宿主机硬盘空间；
除了一块硬盘作为宿主机系统盘外，其余硬盘格式化为 ZFS 文件系统，并可以通过 ZFS 构成 raid 阵列。在 LXD 初始化时直接选择已经创建的 ZFS 分区。

第1种方案由于 ZFS 的空间和宿主机共享，可能导致创建的 ZFS Pool 过大导致宿主机硬盘空间过小，届时可能无法通过ssh连接，需要在宿主机手动删除一些文件才可继续使用。

严重警告！！！ZFS 只支持扩容，不支持缩容，否则将带来不可逆的文件丢失。

因此这里推荐使用第2种方式，因为这样宿主机与容器的存储分离开来，存储逻辑更清晰。

宿主机系统推荐使用 Ubuntu Server，即不带桌面的版本，这样作为服务器更稳定。

宿主机安装时硬盘选择了 LVM 分区格式，但是他只分配了 200 GB，其他空间没有利用。因此需要使用以下命令将 LVM 分区扩容，占用整个硬盘空间：

sudo fdisk -l

sudo pvdisplay
sudo vgdisplay
sudo lvdisplay
sudo lvextend -r -l +100%Free /dev/ubuntu-vg/ubuntu-lv

df -hl

使用下面的命令对硬盘 /dev/sda 进行 ZFS 的分区格式，如果组 raid 可以上网查。

sudo apt install zfsutils-linux
# 创建 ZFS 普通分区
sudo zpool create zfs_lvm sda
# 创建 ZFS mirror（raid1）分区
sudo zpool create zfs_lvm mirror sda sdb
# 创建 ZFS raidz（raid5）分区：
sudo zpool create zfs_lvm raidz sdb sdc sdd sde

其中 zfs_lvm 为 ZFS Pool 的名字。

换 apt 源

sudo mv /etc/apt/sources.list /etc/apt/sources.list.bak
sudo vim /etc/apt/sources.list

如下为哈工大源：

# 默认注释了源码镜像以提高 apt update 速度，如有需要可自行取消注释
deb http://mirrors.hit.edu.cn/ubuntu/ focal main restricted universe multiverse
# deb-src http://mirrors.hit.edu.cn/ubuntu/ focal main restricted universe multiverse
deb http://mirrors.hit.edu.cn/ubuntu/ focal-updates main restricted universe multiverse
# deb-src http://mirrors.hit.edu.cn/ubuntu/ focal-updates main restricted universe multiverse
deb http://mirrors.hit.edu.cn/ubuntu/ focal-backports main restricted universe multiverse
# deb-src http://mirrors.hit.edu.cn/ubuntu/ focal-backports main restricted universe multiverse
deb http://mirrors.hit.edu.cn/ubuntu/ focal-security main restricted universe multiverse
# deb-src http://mirrors.hit.edu.cn/ubuntu/ focal-security main restricted universe multiverse

# 预发布软件源，不建议启用
# deb http://mirrors.hit.edu.cn/ubuntu/ focal-proposed main restricted universe multiverse
# deb-src http://mirrors.hit.edu.cn/ubuntu/ focal-proposed main restricted universe multiverse

更新源：

sudo apt update
sudo apt upgrade

固定内核版本

sudo apt-mark hold linux-image-generic linux-headers-generic

防止内核升级导致显卡驱动失效。因为显卡驱动需要编译内核版本，升级内核后显卡驱动需要重新编译安装。由于 LXD 容器共享内核，升级内核会导致所有显卡驱动都需要重新安装。

配置宿主机网络

需要更改宿主机网络为网桥模式，这样才能使容器和宿主机处于同一网络子层，在同一局域网的计算机可以直接 ssh 链接。

Ubuntu 17.10 以后默认使用 Netplan 管理网络。

进入 /etc/netplan/ 目录有一个 yaml 配置文件，下面的命令需要根据自己的 yaml 文件名称自行修改

sudo cp /etc/netplan/01-netcfg.yaml /etc/netplan/01-netcfg.yaml.bak
sudo vim /etc/netplan/01-netcfg.yaml

如下：

# This file describes the network interfaces available on your system
# For more information, see netplan(5).
network:
  version: 2
  renderer: networkd
  ethernets:
    eno1:
      dhcp4: no
      dhcp6: no
  bridges:
    br0:
      dhcp4: no
      dhcp6: no
      interfaces:
        - eno1
      addresses: [ 192.168.100.123/24 ]
      gateway4: 192.168.100.254
      nameservers:
          addresses:
              - 114.114.114.114
              - 8.8.8.8
      parameters:
          stp: false
          forward-delay: 0

addresses: [ 192.168.100.123/24 ] 为任意网络无人占用的 IP 即可。
gateway4: 192.168.100.254 为网关地址。
eno1 为网卡名称，可以使用 ip a 或 ifconfig 命令查看。

应用网络配置：

sudo netplan --debug apply

安装 lxd、zfs 及 bridge-utils

sudo snap install lxd
sudo apt install zfsutils-linux bridge-utils

我们需要安装 LXD 实现虚拟容器，ZFS 作为 LXD 的存储管理工具，bridge-utils 用于搭建网桥。由于 apt 安装的 LXD 不是最新版本，这里使用 snap 安装工具安装 LXD。

安装宿主机显卡驱动

去 NVIDIA 官网下载最新驱动，这里下载的是 ./NVIDIA-Linux-x86_64-418.56.run。

由于系统是 ubuntu-server，所以简单很多，如果是安装的 ubuntu-desktop，建议用其他电脑 ssh 远程连接后再安装。如果一定要在有 desktop 的系统安装显卡驱动，可以参考：超详细! Ubuntu 18.04 安装 NVIDIA 显卡驱动

安装依赖：

sudo apt install gcc g++ make

安装驱动：

sudo bash ./NVIDIA-Linux-x86_64-418.56.run

查看显卡：

nvidia-smi

此时发现输入 nvidia-smi 命令后需要 3 秒左右才会出结果，并且显卡功率占用较高，没有程序运行就有一百多瓦的功耗。

为了解决这些问题，需要将显卡模式改为持久模式，该命令需要 root 权限：

sudo nvidia-smi -pm 1

持久模式使得输出结果反应迅速，并且功耗得到降低。但是重启后该模式会默认关闭，需要添加自启动命令，在后面会讲到。

LXD 初始化

sudo lxd init

在初始化过程中，不要创建新的网桥，已存在的网桥名为 br0，其他设置默认即可。

当采用提前将整个硬盘作为 ZFS 分区，这时在是否创建新的 ZFS Pool 时选 no，并填写已经存在的 ZFS pool 的名字。如下所示：

Would you like to use LXD clustering? (yes/no) [default=no]:
Do you want to configure a new storage pool? (yes/no) [default=yes]:
Name of the new storage pool [default=default]: zfs-pool
Name of the storage backend to use (lvm, zfs, ceph, btrfs, dir) [default=zfs]:
Create a new ZFS pool? (yes/no) [default=yes]: no
Name of the existing ZFS pool or dataset: zfs_lvm
Would you like to connect to a MAAS server? (yes/no) [default=no]:
Would you like to create a new local network bridge? (yes/no) [default=yes]: no
Would you like to configure LXD to use an existing bridge or host interface? (yes/no) [default=no]: yes
Name of the existing bridge or host interface: br0
Would you like the LXD server to be available over the network? (yes/no) [default=no]:
Would you like stale cached images to be updated automatically? (yes/no) [default=yes]
Would you like a YAML "lxd init" preseed to be printed? (yes/no) [default=no]:

当采用所有硬盘作为宿主机硬盘时，需要在 LXD 初始化时创建新的 ZFS Pool，ZFS设置大小要尽量大，如下所示：

Would you like to use LXD clustering? (yes/no) [default=no]:
Do you want to configure a new storage pool? (yes/no) [default=yes]:
Name of the new storage pool [default=default]: lxd
Name of the storage backend to use (btrfs, ceph, dir, lvm, zfs) [default=zfs]:
Create a new ZFS pool? (yes/no) [default=yes]:
Would you like to use an existing block device? (yes/no) [default=no]:
Size in GB of the new loop device (1GB minimum) [default=100GB]: 1200
Would you like to connect to a MAAS server? (yes/no) [default=no]:
Would you like to create a new local network bridge? (yes/no) [default=yes]: no
Would you like to configure LXD to use an existing bridge or host interface? (yes/no) [default=no]: yes
Name of the existing bridge or host interface: br0
Would you like LXD to be available over the network? (yes/no) [default=no]:
Would you like stale cached images to be updated automatically? (yes/no) [default=yes]
Would you like a YAML "lxd init" preseed to be printed? (yes/no) [default=no]:

创建容器

创建的容器最好和宿主机系统相同。

sudo lxc launch ubuntu:20.04

查看容器列表：

sudo lxc list

更改容器名

为了后续方便，我们将容器名进行修改：

sudo lxc stop equipped-locust
sudo lxc rename equipped-locust template
sudo lxc start template

为容器添加设备和权限

sudo lxc config device add template gpu gpu
sudo lxc config set template security.nesting true
sudo lxc config set template security.privileged true

制作容器模板

先配置一个网络、驱动都正常的容器，制作快照并作为模板，这样需要创建新容器时可以从快照创建，节省时间。

更换容器的 apt 源

与宿主机更换方法相同。

配置容器网络

可以通过容器的 NAME 进入容器：

sudo lxc exec template bash

其中 template 为容器名。

进入容器后默认是 root 用户，首先安装 net-tools：

apt install net-tools

通过 ifconfig 命令查看网卡名为 eth0：

和宿主机一样，进入 /etc/netplan/ 目录有一个 yaml 配置文件，下面的命令需要根据自己的 yaml 文件名称自行修改：

编辑 yaml 配置文件：

mv /etc/netplan/50-cloud-init.yaml /etc/netplan/50-cloud-init.yaml.bak
vim /etc/netplan/50-cloud-init.yaml

如下：

network:
  version: 2
  ethernets:
    eth0:
      dhcp4: no
      dhcp6: no
      addresses:
        - 192.168.100.124/24
      gateway4: 192.168.100.254
      nameservers:
        addresses:
          - 114.114.114.114
          - 8.8.8.8

应用网络配置：

netplan --debug apply

更改容器用户名和密码

容器默认用户名为 ubuntu，这里想把他改成 tmp，命令如下：

usermod -l tmp -d /home/tmp -m ubuntu
groupmod -n tmp ubuntu

此时 /home 文件夹下只剩下 tmp 目录。

更改 tmp 用户的密码：

passwd tmp

然后输入两次新密码。

配置容器 ssh 连接

apt install openssh-server

编辑 ssh 配置文件：

vim /etc/ssh/sshd_config

将 PasswordAuthentication 改为 yes，退出编辑后重启 ssh 服务：

systemctl restart sshd

此时可以用 exit 命令退出到宿主机中，尝试用 ssh 命令远程连接容器：

ssh tmp@192.168.100.124

输入密码，能登录则没问题。

添加初始化容器脚本

为了方便以后初始化容器，我们将网络初始化等命令写入脚本。在容器的 /root/ 目录执行 vim init_lxd.sh 命令创建脚本，编辑如下：

# !/bin/bash
read -p "Enter your last name as the username, such as zhang: " last_name
read -p "Enter the password of the container: " password
read -p "Enter the IP address:" IP

echo "Change username to $last_name"
usermod -l $last_name -d /home/$last_name -m tmp
groupmod -n $last_name tmp

echo "Change IP to $IP"
mv /etc/netplan/50-cloud-init.yaml /etc/netplan/50-cloud-init.yaml.bak
echo "network:
  version: 2
  ethernets:
    eth0:
      dhcp4: no
      dhcp6: no
      addresses:
        - $IP/24
      gateway4: 192.168.100.254
      nameservers:
        addresses:
          - 114.114.114.114
          - 8.8.8.8" > /etc/netplan/50-cloud-init.yaml

netplan --debug apply

echo "$last_name:$password" | sudo chpasswd

reboot

安装容器的显卡驱动

容器和宿主机的显卡驱动必须保持一致，因此需要将宿主机的驱动文件传输到容器中。因为刚安好了 ssh，因此可以选择 scp 传输。在宿主机中输入以下命令：

scp ./NVIDIA-Linux-x86_64-418.56.run tmp@192.168.100.124:/home/tmp/

也可以通过 lxc 命令传输。在宿主机中输入以下命令：

sudo lxc file push ./NVIDIA-Linux-x86_64-418.56.run template/home/tmp/NVIDIA-Linux-x86_64-418.56.run

以上两种方法均可传输文件。

传输后通过 ssh 进入容器，输入以下命令安装显卡驱动：

sudo bash ./NVIDIA-Linux-x86_64-418.56.run --no-kernel-module

由于容器和宿主机共享内核，所以在安装容器的显卡驱动时需要添加 --no-kernel-module 参数。

安装好显卡驱动后用 nvidia-smi 命令查看显卡：

创建容器快照

在宿主机执行以下命令，对 template 容器创建一个名为 gpu 的快照：

sudo lxc snapshot template gpu

创建容器脚本

现在容器模板已经制作完成，创建新的容器只需要将容器模板的快照进行复制并恢复，即可得到一个新的容器，但是命令比较复杂，因此我将其整理为脚本。在宿主机执行 vim create_container.sh 创建脚本文件，编辑如下：

# !/bin/bash
passwd='xxxx'

read -p "Enter your full name as the container name, such as zhangsan: " name

echo "Create the container $name..."
echo $passwd | sudo -S lxc copy template/gpu $name

echo "Start the container $name..."
echo $passwd | sudo -S lxc start $name

sudo -S lxc exec $name -- /bin/bash

其中 passwd 为容器的默认密码。

解决重启宿主机导致容器显卡驱动找不到的问题

此时如果重启宿主机，我们会发现容器中显卡驱动消失。目前找到的解决办法是在宿主机运行一次 pytorch cuda 的程序，并重启容器。因此我们需要在宿主机安装 PyTorch，并在开机时自动执行 import torch; print(torch.cuda.is_available()) 命令。

安装 Anaconda

在官网下载 Anaconda3，也可以用以下命令：

wget https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh

安装Anaconda（一定不要用 sudo）：

bash ./Anaconda3-2022.05-Linux-x86_64.sh

Anaconda 换源（哈工大）：创建 .condarc

vim ~/.condarc

编辑如下：

channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.hit.edu.cn/anaconda/pkgs/main
  - https://mirrors.hit.edu.cn/anaconda/pkgs/r
  - https://mirrors.hit.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.hit.edu.cn/anaconda/cloud
  msys2: https://mirrors.hit.edu.cn/anaconda/cloud
  bioconda: https://mirrors.hit.edu.cn/anaconda/cloud
  menpo: https://mirrors.hit.edu.cn/anaconda/cloud
  pytorch: https://mirrors.hit.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.hit.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.hit.edu.cn/anaconda/cloud

运行 conda clean -i 清除索引缓存，保证用的是镜像站提供的索引。

安装 PyTorch

在 PyTorch 官网查看对应版本的安装命令，建议创建一个新的 PyTorch 环境：

conda create -n pt1.12 pytorch torchvision torchaudio cudatoolkit=11.6 -c pytorch -c conda-forge

设置开机自启动命令

编辑 rc-local.service：

sudo vim /lib/systemd/system/rc-local.service

末尾添加以下三行：

[Install]  
WantedBy=multi-user.target    
Alias=rc-local.service

新建 rc.local

sudo vim /etc/rc.local

编辑如下：

#!/bin/sh
sleep 180s
sudo nvidia-smi -pm 1
/home/j1812/anaconda3/envs/pt1.12/bin/python -c 'import torch; print(torch.cuda.is_available())'
sudo lxc stop template --force
sudo lxc start template
exit 0

增加 rc.local 可执行权限：

sudo chmod u+x /etc/rc.local

设置开机启动：

sudo systemctl enable rc-local
sudo systemctl start rc-local

检查是否启动成功：

sudo systemctl status rc-local

至此，已经完成了所有 LXD 的配置。

当不知道哪个容器正在占用显卡时，使用下面的命令查询：

nvidia-smi | grep -E 'python.*[0-9]{3,4}MiB' | awk '{print $5}' | xargs -I{} sh -c 'echo "PID: {} Cgroup: $(cat /proc/{}/cgroup | grep rdma | cut -d ":" -f 3)"'

从运行 nvidia-smi 命令结果中获取占用GPU的Python进程的PID，然后通过 xargs 将PID传递给 sh 命令，进而在shell中执行一条命令来查看进程所属的 rdma 类型的cgroup。

具体来说，awk '{print $5}' 的作用是从 nvidia-smi 命令结果中获取占用GPU的Python进程的PID，其中 $5 是因为 nvidia-smi 命令结果中Python进程PID位于第5列。接着，xargs -I{} sh -c 将PID传递给 sh 命令，并在shell中执行一条命令。这条命令通过 cat /proc/{}/cgroup | grep rdma | cut -d ":" -f 3 获取进程所属的 rdma 类型的cgroup路径，并且通过 echo 命令输出PID和对应的cgroup路径。

设备序列号硬盘序列号等查询方法

2022-07-06T11:05:00.000Z

windows

设备序列号

wmic bios get serialnumber

硬盘序列号

wmic diskdrive get serialnumber

操作系统安装时间

systeminfo

IP地址 MAC地址

ipconfig /all

Linux

设备序列号

sudo dmidecode -s system-serial-number

硬盘序列号

sudo lsblk
sudo lsblk -o name,type,serial /dev/nvme0n1

操作系统安装时间

df -P /
sudo dumpe2fs /dev/mapper/ubuntu--vg-root | grep 'Filesystem created:'

IP地址 MAC地址

ifconfig

m1 mac 将系统装入外置硬盘

2021-11-24T10:10:16.000Z

在购买 m1 mac mini 时，硬盘选择多大的容量仍然是让人十分纠结，256GB 的空间需要1500元的差价，这个价格都可以购买 2TB 的 NVMe 硬盘了。

因此，使用雷电3协议的外接硬盘是扩展硬盘容量的简单方法，尤其是对于mac mini这种几乎不移动的设备。

外接扩容有两种方法：

一种是仅将大型软件、大型数据、虚拟机等存放到外置硬盘中，可以既享受高速的内置硬盘，也可以满足临时存储大型数据的需求。不需要重装系统，但是割裂了使用体验。
另一种是将整个系统都装在外置硬盘中，这样相当于购买了大容量的硬盘空间版本，保持了完整的系统使用体验，同时内置硬盘也可以用来存储文件。如果后续需要更换电脑，直接在新电脑上接上硬盘即可正常使用，无需备份恢复等操作（前提是内置硬盘系统与外置硬盘的系统大版本一致，之前所有的正版软件需要重新授权）。

这里我选择的是第二种扩容方法，可能是采用了M1芯片的原因，网上的方法大多不好使，踩了一些坑，在此记录一下。

硬盘盒和硬盘

这里硬盘盒选择的牌子是ACASIS，只支持雷电3协议，性价比算是非常高的了，前两年雷电3协议的硬盘盒动辄要600多，今年降价了不少，这款2021双十一大概350元在拼多多买的，在正常运行时外壳微热不烫手，散热非常不错。

硬盘选择的是闪迪1TB（sn550同款），固件21，发热量较小，硬盘盒几乎达到了硬盘的读写速度上限。虽然读写速度相较于内置硬盘有所下降，但是正常使用几乎感受不到区别。

使用 AmorphousDiskMark 软件进行测速结果如下，内置硬盘比外置硬盘速度要快很多，尤其是4k方面。

因此，我建议把平时经常读写硬盘的大型应用放入内置硬盘中，可以充分利用内置硬盘和外置硬盘。

格式化硬盘

在 实用工具 中找到 磁盘工具，显示里选择 显示所有设备：

选择外接硬盘，点击抹掉，并将名称改为macOS，格式为APFS，方案为GUID分区图：

下载系统

打开 App Store，搜索 macos，就可以找到最新的版本 macos monterey，下载后便可以在应用程序中找到 安装macOS Monterey.app。需要注意的是，系统镜像必须从APP Store进行下载，否则不允许安装。

这时传统的方法会双击这个安装macOS Monterey.app并选择将系统安装到外接硬盘中，但是我操作后无法进入系统，在系统偏好设置中点击启动磁盘，将启动磁盘设为macOS外接硬盘时会报错：无法设定启动磁盘-将“macOS”设为启动磁盘时出错：未能完成操作。（SDErrorDomain错误108。）

这可能是M1芯片的限制，所以只能进入恢复模式进行安装。

进入恢复模式进行安装

关机后长按电源键进入恢复模式，选择最右侧的选项

在这里如果选择第二项的重新安装macOS Monterey的话需要从网上重新下载镜像，并且我也没有安装成功，所以这里介绍另一种省时省力的方法。

在上面的实用工具中选择终端，或者键盘cmd+shift+T：

在这里输入一行命令，意思就是找到在步骤4中已经下好的安装macOS Monterey.app并进行安装，命令如下：

cd ../../Volumes/Macintosh\ HD/Applications
./Install\ macOS\ Monterey.app/Contents/MacOS/InstallAssistant

稍微懂一些Linux的小伙伴应该能看懂，路径可以一点点试出来。

回车后就进入了安装界面，这时不用下载即可安装：

一路下一步，注意选择macOS的外接硬盘即可，安装完成后会自动进入外接硬盘中的系统。

黑苹果转白苹果心得

最后简单介绍一下自己由黑苹果转白苹果的体会。

之前自己撘过一个黑苹果，由于没有配显卡，Intel的核显的HDMI接口只能支持1080P60帧的显示器，而我希望配两个4K显示器，这就有了两种解决办法：

一是买一块AMD的黑苹果免驱的显卡，继续使用黑苹果，好处是windows系统也可以玩玩游戏，但是RX6600XT 价格在4000元左右，感觉作为显卡来说还是太贵。
二是转战白苹果，买一个m1芯片的mac mini，可以外接两台4K60帧显示器（macbook air只能外接一台4K）。

很明显，我选择了第二种办法。在体验了一周m1芯片的白苹果后，主要感受到了以下区别：

噪音的消失：黑苹果转白苹果，最大的感受就是噪音的消失。m1芯片确实安静的可怕，以至于即使满载CPU跑程序，风扇也只是轻微的转动，听不到任何声音。相比于之前桌子上的趣造小机箱，即使没有显卡，CPU散热的风扇声音也远比mac mini大。
多显示器的支持：之前的黑苹果可能是设置的问题，在开机的时候4K显示器不输出画面，需要重启下显示器才能显示画面，白苹果自然是没有这种问题。
蓝牙、无线、AirDrop：虽然之前的黑苹果安装的也是苹果原装网卡，但是可能是抗干扰能力较差等因素，听音乐有时会断断续续。白苹果如果听歌会断断续续，我只会认为是耳机太差了。
8G内存是否够用：这也是老生常谈的问题，也是我最纠结的一个问题。在代码开发时，当打开的Pycharm工程大于3个并开启多个网页时，确实会感受到反应的卡顿。不过我不太经常会同时打开多个工程，因此认为8G内存对于我来说是足够的。如果还是纠结的话，可以去苹果官网买8+256的官翻试一试，14天无理由退货期间看看8G内存是否够用。

说实话，之前的黑苹果在使用上和白苹果并没有明显区别，要不是因为需要支持双4K显示器，黑苹果可能会接着使用。不过白苹果确实省心，不用为升级系统而担心各种bug，蓝牙wifi连接不稳定也只会认为是设备的问题，光噪声消失这一项我就认为这钱花的值。苹果产品还非常保值，过两年卖了买新款也不心疼。总之，m1的mac mini还是值得购买的。

GCC 编译多平台二进制程序（x64, ARM, MIPS）

2021-08-01T07:48:29.000Z

GCC 在本平台编译比较简单，但是如果在不同平台上进行编译就需要使用交叉编译的技术，虽然命令很简单，但是网上资料还是比较匮乏，踩了不少的坑，现总结如下。

准备工作

我们在 Ubuntu20.04 操作系统下进行操作。需要使用 GCC 编译器，使用命令 gcc -v 检查编译器是否可用，若没有使用下述命令进行安装：

sudo apt update
sudo apt install build-essential

我们使用 binutils 这个开源C++项目作为例子，下载链接如下 https://ftp.gnu.org/gnu/binutils/，下载 binutils-2.37.tar.gz 到服务器目标路径 ~/project/open_source 下。

进入目标路径：

cd ~/project/open_source

使用以下命令进行解压：

tar -zxvf binutils-2.37.tar.gz

创建编译路径并进入：

mkdir binutils-build
cd binutils-build

编译 x64 平台

因为服务器是x64的系统，所以默认编译的二进制也是x64，使用以下命令创建 Makefile 文件：

../binutils-2.37/configure CC=gcc CFLAGS=-O0 CPPFLAGS=-O0

上述为优化选项 O0 的编译结果，如果想改成其他优化选项，更改 CFLAGS 和 CPPFLAGS 里面的参数即可。

使用make命令进行编译：

make

编译成功后，在 binutils 文件夹下可以看到编译好的二进制文件，使用 file 命令可以看到其中 addr2line 二进制文件的详细信息：

file binutils/addr2line
# binutils/addr2line: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, BuildID[sha1]=fc36de2a595215ee0f8dba42cf2fa628699e2610, for GNU/Linux 3.2.0, not stripped

可知该二进制文件为 x86-64 架构的 64-bit 程序。

编译 MIPS 平台

首先使用下述命令删除 binutils-build 文件夹所有文件：

rm -rf *

使用下述命令安装MIPS交叉编译选项

sudo apt-get update
sudo apt-get install gcc-mips-linux-gnu

使用下述命令生成MIPS平台的 Makefile 文件：

../binutils-2.37/configure CFLAGS=-O0 CPPFLAGS=-O0 --host=mips-linux-gnu

其中 --host 表示交叉编译中的目标架构。同样，更改优化选项可直接将O0改为O1等。

使用make命令进行编译：

make

编译成功后，在 binutils 文件夹下可以看到编译好的二进制文件，使用 file 命令可以看到其中 addr2line 二进制文件的详细信息：

file binutils/addr2line
# binutils/addr2line: ELF 32-bit MSB executable, MIPS, MIPS32 rel2 version 1 (SYSV), dynamically linked, interpreter /lib/ld.so.1, BuildID[sha1]=53aa3d29d13350381e9c81b776308e64da46f06d, for GNU/Linux 3.2.0, not stripped

可知该二进制文件为 MIPS 架构的 32-bit 程序。

编译 ARM 平台

首先使用下述命令删除 binutils-build 文件夹所有文件：

rm -rf *

使用下述命令安装MIPS交叉编译选项

sudo apt-get update
sudo apt-get install gcc-arm-linux-gnueabi

使用下述命令生成MIPS平台的 Makefile 文件：

../binutils-2.37/configure CFLAGS=-O0 CPPFLAGS=-O0 --host=arm-linux-gnueabi

其中 --host 表示交叉编译中的目标架构。同样，更改优化选项可直接将O0改为O1等。

使用make命令进行编译：

make

编译成功后，在 binutils 文件夹下可以看到编译好的二进制文件，使用 file 命令可以看到其中 addr2line 二进制文件的详细信息：

file binutils/addr2line
# binutils/addr2line: ELF 32-bit LSB executable, ARM, EABI5 version 1 (SYSV), dynamically linked, interpreter /lib/ld-linux.so.3, BuildID[sha1]=f3c359a16a4390cd2f8a1ac13365b49ce9a7b5ef, for GNU/Linux 3.2.0, not stripped

可知该二进制文件为 ARM 架构的 32-bit 程序。

PyTorch 的 BERT 微调教程

2020-06-06T10:48:29.000Z

本文为博客 BERT Fine-Tuning Tutorial with PyTorch 的翻译

在本教程中，我将向你展示如何使用 BERT 与 huggingface PyTorch 库来快速高效地微调模型，以获得接近句子分类的最先进性能。更广泛地讲，我将描述转移学习在NLP中的实际应用，以最小的努力在一系列NLP任务上创建高性能模型。

介绍

历史

2018年是NLP的突破性一年。转移学习，特别是像Allen AI的ELMO、OpenAI的Open-GPT和谷歌的BERT这样的模型，让研究人员用最小的特定任务微调粉碎了多个基准，并为NLP社区的其他成员提供了预训练的模型，这些模型可以轻松地（用更少的数据和更少的计算时间）进行微调和实施，以产生最先进的结果。遗憾的是，对于许多刚开始接触NLP的人，甚至对于一些有经验的实践者来说，这些强大模型的理论和实际应用仍然没有得到很好的理解。

什么是 BERT?

BERT（Bidirectional Encoder Representations from Transformers）于2018年底发布，我们将在本教程中使用该模型，为读者更好地理解和实践指导在NLP中使用转移学习模型。BERT是一种预训练语言表征的方法，它被用来创建模型，然后NLP实践者可以免费下载并使用这些模型。你可以使用这些模型从你的文本数据中提取高质量的语言特征，也可以用你自己的数据在特定的任务（分类、实体识别、问题回答等）上对这些模型进行微调，以产生最先进的预测。

这篇文章将解释如何修改和微调BERT，以创建一个强大的NLP模型，快速给你提供最先进的结果。

微调的优势

在本教程中，我们将使用BERT来训练一个文本分类器。具体来说，我们将把预先训练好的 BERT 模型，在最后添加一层未经训练的神经元，并为我们的分类任务训练新模型。为什么要这样做，而不是训练一个很适合你需要的特定深度学习模型（CNN、BiLSTM等）？

更快的发展
- 首先，预先训练的BERT模型权重已经编码了很多关于我们语言的信息。因此，训练我们的微调模型所需要的时间要少得多--就好像我们已经广泛地训练了我们网络的底层，只需要在使用它们的输出作为分类任务的特征时轻轻地调整它们。事实上，作者建议在特定的NLP任务上对BERT进行微调只需要2-4个纪元的训练（相比之下，从头开始训练原始的BERT模型或LSTM需要数百个GPU小时！）。
更少的数据
- 此外，也许同样重要的是，由于预先训练的权重，这种方法允许我们在一个比从头开始建立的模型所需的更小的数据集上微调我们的任务。从零开始建立的NLP模型的一个主要缺点是，我们通常需要一个大得令人望而却步的数据集来训练我们的网络以达到合理的精度，这意味着必须将大量的时间和精力投入到数据集的创建中。通过对BERT的微调，我们现在能够摆脱在更小的训练数据量上训练一个模型达到良好的性能。
更好的结果
- 最后，这种简单的微调程序（通常是在BERT的基础上增加一个全连接的层，并进行几个纪元的训练）被证明可以通过最小的任务特定调整来实现最先进的结果，适用于各种各样的任务：分类、语言推理、语义相似性、问题回答等。与其实施在特定任务上表现出良好效果的定制和有时模糊的架构，不如简单地对BERT进行微调，这被证明是一个更好的（或至少相等的）替代方案。

NLP的转变

这种向转移学习的转变与几年前计算机视觉领域发生的相同转变并行。为计算机视觉任务创建一个好的深度学习网络可能需要数百万个参数，而且训练成本非常高。研究人员发现，深度网络可以学习分层的特征表示（在最低层有简单的特征，如边缘，在较高层有逐渐复杂的特征）。与其每次从头开始训练一个新的网络，不如将训练好的网络的低层泛化图像特征复制并转移到另一个有不同任务的网络中使用。很快，下载一个预先训练好的深度网络，并迅速对其进行重新训练以适应新的任务，或者在上面添加额外的层，这比从头开始训练网络的昂贵过程要好得多。对于许多人来说，2018年引入的深度预训练语言模型（ELMO、BERT、ULMFIT、Open-GPT等）标志着NLP中向转移学习的转变，就像计算机视觉看到的那样。

让我们开始吧！

1. 设置

1.1. 检查 GPU

为了让 torch 使用 GPU，我们需要识别并指定 GPU 作为设备。稍后，在我们的训练循环中，我们将把数据加载到设备上。

import torch

# If there's a GPU available...
if torch.cuda.is_available():    

    # Tell PyTorch to use the GPU.    
    device = torch.device("cuda")
    
    print('There are %d GPU(s) available.' % torch.cuda.device_count())
    
    print('We will use the GPU:', torch.cuda.get_device_name(0))

# If not...
else:
    print('No GPU available, using the CPU instead.')
    device = torch.device("cpu")

1.2. 安装 HuggingFace 库

接下来，让我们安装 HuggingFace 的transformers包，它将为我们提供一个与BERT一起工作的pytorch接口。（这个库包含了其他预训练语言模型的接口，如OpenAI的GPT和GPT-2）。我们选择了pytorch接口，因为它在高级API（它很容易使用，但不能深入了解事情的工作原理）和tensorflow代码（它包含了很多细节，但经常让我们偏离了关于tensorflow的课程，而这里的目的是BERT！）之间取得了很好的平衡。

目前，Hugging Face库似乎是最被广泛接受的、最强大的与BERT合作的pytorch接口。除了支持各种不同的预先训练好的变换模型外，该库还包含了这些模型的预构建修改，适合你的特定任务。例如，在本教程中，我们将使用BertForSequenceClassification。

该库还包括用于标记分类、问题回答、下句预测等的特定任务类。使用这些预建的类可以简化为您的目的修改BERT的过程。

本笔记本中的代码其实是 HuggingFace 的run_glue.py示例脚本的简化版。

run_glue.py是一个很有用的工具，它允许你选择你想运行的GLUE基准任务，以及你想使用的预训练模型（你可以看到可能的模型列表这里）。它还支持使用CPU、单个GPU或多个GPU。如果你想进一步提高速度，它甚至支持使用16位精度。

不幸的是，所有这些可配置性都是以可读性为代价的。在这篇Notebook中，我们已经大大简化了代码，并添加了大量的注释，以使其清楚地了解发生了什么。

2. 加载 CoLA 数据集

我们将使用The Corpus of Linguistic Acceptability (CoLA)数据集进行单句分类。它是一组被标记为语法正确或不正确的句子。它于2018年5月首次发布，是 "GLUE Benchmark "中包含的测试之一，BERT等模型都在此基础上进行比赛。

2.1. 下载和解压

该数据集托管在GitHub上的这个repo中：https://nyu-mll.github.io/CoLA/，下载链接

2.2. 解析

我们可以从文件名中看到，"tokenized" 和 "raw"版本的数据都是可用的。

我们不能使用预标记版本，因为为了应用预训练的BERT，我们必须使用模型提供的标记器。这是因为：（1）模型有一个特定的、固定的词汇，（2）BERT tokenizer有一种特殊的方式来处理词汇外的词汇。

我们将使用pandas来解析"域内"训练集，并查看其一些属性和数据点。

import pandas as pd

# Load the dataset into a pandas dataframe.
df = pd.read_csv("./cola_public/raw/in_domain_train.tsv", delimiter='\t', header=None, names=['sentence_source', 'label', 'label_notes', 'sentence'])

# Report the number of sentences.
print('Number of training sentences: {:,}\n'.format(df.shape[0]))

# Display 10 random rows from the data.
df.sample(10)

我们实际关心的两个属性是"句子"和它的"标签"，这个标签被称为"可接受性判断"（0=不可接受，1=可接受）。

下面是五个被标注为语法上不可接受的句子。请注意，这个任务比情感分析之类的工作要难得多!

print(df.loc[df.label == 0].sample(5)[['sentence', 'label']])

让我们将训练集的句子和标签提取为 numpy ndarrays。

# Get the lists of sentences and their labels.
sentences = df.sentence.values
labels = df.label.values

3. Tokenization & Input 格式化

在本节中，我们将把我们的数据集转换为BERT可以训练的格式。

3.1. BERT Tokenizer

为了将我们的文本输入到 BERT，必须将其分割成 tokens，然后这些 tokens 必须被映射到 tokenizer 词汇表中的索引。

Tokenization 必须由 BERT 中包含的 Tokenizer 来执行--下面的单元格将为我们下载。我们将在这里使用 "uncases "版本。

from transformers import BertTokenizer

# Load the BERT tokenizer.
print('Loading BERT tokenizer...')
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased', do_lower_case=True)

让我们把tokenizer应用到一个句子上，看看输出。

# Print the original sentence.
print('Original: ', sentences[0])

# Print the sentence split into tokens.
print('Tokenized: ', tokenizer.tokenize(sentences[0]))

# Print the sentence mapped to token ids.
print('Token IDs: ', tokenizer.convert_tokens_to_ids(tokenizer.tokenize(sentences[0])))

当我们实际转换所有的句子时，我们将使用tokenize.encode函数来处理这两个步骤，而不是分别调用tokenize和convert_tokens_to_ids。

不过，在我们这样做之前，我们需要先谈谈BERT的一些格式化要求。

3.2. 需要的格式化

上面的代码遗漏了一些必要的格式化步骤，我们将在这里看看。

补充说明：我觉得BERT的输入格式似乎 "过于规范"了......。我们被要求提供一些信息，这些信息看起来是多余的，或者说它们可以很容易地从数据中推断出来，而不需要我们明确地提供。但事实就是如此，我想一旦我对BERT的内部结构有了更深入的了解，它就会变得更有意义。

我们需要做的是 1. 在每个句子的开头和结尾添加特殊的标记。 2. 将所有句子的长度固定为一个固定的长度。 3. 用"注意力遮盖"明确区分真正的 token 和填充 token。

特殊 Tokens

[SEP]

在每个句子的末尾，我们需要附加特殊的"[SEP]"令牌。

这个标记是双句子任务的产物，即给BERT两个独立的句子，并要求它确定一些事情（例如，句子A中的问题的答案能否在句子B中找到？

我还不确定为什么当我们只有单句输入的时候，还需要 token，但它确实需要!

[CLS]

对于分类任务，我们必须在每个句子的开头加上特殊的"[CLS]"标记。

这个标记具有特殊的意义。BERT 由12个 Transformer 层组成。每个 Transformer 都会接收一个标记嵌入的列表，并在输出中产生相同数量的嵌入（当然是改变了特征值！）。

在最后一个(第12个) Transformer 的输出端，分类器只使用第一个嵌入(对应[CLS]标记)。

"The first token of every sequence is always a special classification token ([CLS]). The final hidden state corresponding to this token is used as the aggregate sequence representation for classification tasks." (摘自BERT论文)

你可能会想到在最终的嵌入上尝试一些池化策略，但这并不是必须的。因为 BERT 被训练成只使用这个[CLS]标记进行分类，我们知道模型已经被激励将分类步骤所需的一切编码到那个单一的 768 值嵌入向量中。它已经为我们完成了池化工作!

句子长度 & 注意力遮盖

我们数据集中的句子显然有不同的长度，那么BERT是如何处理的呢？

BERT有两个约束条件。 1. 所有的句子必须被填充或截断成一个固定的长度。 2. 最大的句子长度是512个tokens。

填充是通过一个特殊的"[PAD]"令牌来完成的，它在BERT词汇表中的索引0。下面的插图演示了填充到8个令牌的 "MAX_LEN"。

"注意力遮盖"只是一个1和0的数组，表示哪些标记是padding，哪些不是（看起来有点多余，不是吗！）。这个掩码告诉BERT中的"自我关注"机制不要将这些pad标记纳入它对句子的解释中。

不过，最大长度确实会影响训练和评估速度。

例如，用特斯拉K80。

MAX_LEN = 128 --> 训练一个 epoch 需要 5:28

MAX_LEN = 64 --> 训练一个 epoch 需要 2:57。

3.3. Tokenize 数据集

transformers库提供了一个有用的 "encode" 函数，它将为我们处理大部分的解析和数据准备步骤。

在我们准备好对文本进行编码之前，我们需要决定一个最大句子长度来进行填充/截断。

下面的单元格将对数据集进行一次标记化处理，以测量最大句子长度。

max_len = 0

# For every sentence...
for sent in sentences:

    # Tokenize the text and add `[CLS]` and `[SEP]` tokens.
    input_ids = tokenizer.encode(sent, add_special_tokens=True)
    
    # Update the maximum sentence length.
    max_len = max(max_len, len(input_ids))

print('Max sentence length: ', max_len)

为了防止有一些较长的测试句子，我将最大长度设置为64。

现在我们准备好执行真正的 tokenization 了。

tokenizer.encode_plus函数为我们结合了多个步骤。

将句子分割成token。
添加特殊的[CLS]和[SEP]标记。
将这些标记映射到它们的ID上。
把所有的句子都垫上或截断成相同的长度。
创建注意力遮盖，明确区分真实 token 和[PAD]token。

前四项功能在tokenizer.encode中，但我使用tokenizer.encode_plus来获得第五项（注意力遮盖）。文档在这里.

# Tokenize all of the sentences and map the tokens to thier word IDs.
input_ids = []
attention_masks = []

# For every sentence...
for sent in sentences:
    # `encode_plus` will:
    #   (1) Tokenize the sentence.
    #   (2) Prepend the `[CLS]` token to the start.
    #   (3) Append the `[SEP]` token to the end.
    #   (4) Map tokens to their IDs.
    #   (5) Pad or truncate the sentence to `max_length`
    #   (6) Create attention masks for [PAD] tokens.
    encoded_dict = tokenizer.encode_plus(
                        sent,                      # Sentence to encode.
                        add_special_tokens = True, # Add '[CLS]' and '[SEP]'
                        max_length = 64,           # Pad & truncate all sentences.
                        pad_to_max_length = True,
                        return_attention_mask = True,   # Construct attn. masks.
                        return_tensors = 'pt',     # Return pytorch tensors.
                   )
    
    # Add the encoded sentence to the list.    
    input_ids.append(encoded_dict['input_ids'])
    
    # And its attention mask (simply differentiates padding from non-padding).
    attention_masks.append(encoded_dict['attention_mask'])

# Convert the lists into tensors.
input_ids = torch.cat(input_ids, dim=0)
attention_masks = torch.cat(attention_masks, dim=0)
labels = torch.tensor(labels)

# Print sentence 0, now as a list of IDs.
print('Original: ', sentences[0])
print('Token IDs:', input_ids[0])

3.4. 训练 & 验证切分

把我们的训练集分成 90% 用于训练，10% 用于验证。

from torch.utils.data import TensorDataset, random_split

# Combine the training inputs into a TensorDataset.
dataset = TensorDataset(input_ids, attention_masks, labels)

# Create a 90-10 train-validation split.

# Calculate the number of samples to include in each set.
train_size = int(0.9 * len(dataset))
val_size = len(dataset) - train_size

# Divide the dataset by randomly selecting samples.
train_dataset, val_dataset = random_split(dataset, [train_size, val_size])

print('{:>5,} training samples'.format(train_size))
print('{:>5,} validation samples'.format(val_size))

我们还将使用 torch DataLoader 类为我们的数据集创建一个迭代器。这有助于在训练过程中节省内存，因为与for循环不同，有了迭代器，整个数据集不需要加载到内存中。

from torch.utils.data import DataLoader, RandomSampler, SequentialSampler

# The DataLoader needs to know our batch size for training, so we specify it 
# here. For fine-tuning BERT on a specific task, the authors recommend a batch 
# size of 16 or 32.
batch_size = 32

# Create the DataLoaders for our training and validation sets.
# We'll take training samples in random order. 
train_dataloader = DataLoader(
            train_dataset,  # The training samples.
            sampler = RandomSampler(train_dataset), # Select batches randomly
            batch_size = batch_size # Trains with this batch size.
        )

# For validation the order doesn't matter, so we'll just read them sequentially.
validation_dataloader = DataLoader(
            val_dataset, # The validation samples.
            sampler = SequentialSampler(val_dataset), # Pull out batches sequentially.
            batch_size = batch_size # Evaluate with this batch size.
        )

4. 训练我们的分类模型

现在我们的输入数据已经被正确格式化了，是时候微调一下BERT模型了。

4.1. BertForSequenceClassification

对于这个任务，我们首先要修改预先训练好的 BERT 模型，给出分类的输出，然后我们要在我们的数据集上继续训练模型，直到整个模型，端到端都很适合我们的任务。

值得庆幸的是，huggingface pytorch的实现中包含了一套针对各种NLP任务设计的接口。虽然这些接口都是建立在训练好的 BERT 模型之上，但每个接口都有不同的顶层和输出类型，以适应其特定的 NLP 任务。

以下是目前提供的类列表，供微调。

BertModel
BertForPreTraining
BertForMaskedLM
BertForNextSentencePrediction(下句预测)
BertForSequenceClassification - 我们将使用的那个。
BertForTokenClassification
BertForQuestionAnswering

这些文档可以在这里下找到。

我们将使用BertForSequenceClassification。这是普通的BERT模型，上面增加了一个用于分类的单线性层，我们将使用它作为句子分类器。当我们输入数据时，整个预先训练好的BERT模型和额外的未经训练的分类层会根据我们的特定任务进行训练。

OK，让我们加载 BERT 吧! 有几个不同的预训练 BERT 模型可供选择。"bert-base-uncased "指的是只有小写字母（"uncased"）的版本，是两者中较小的版本（"base "vs "large"）。

from_pretrained的文档可以在这里找到，附加参数定义在这里。

from transformers import BertForSequenceClassification, AdamW, BertConfig

# Load BertForSequenceClassification, the pretrained BERT model with a single 
# linear classification layer on top. 
model = BertForSequenceClassification.from_pretrained(
    "bert-base-uncased", # Use the 12-layer BERT model, with an uncased vocab.
    num_labels = 2, # The number of output labels--2 for binary classification.
                    # You can increase this for multi-class tasks.   
    output_attentions = False, # Whether the model returns attentions weights.
    output_hidden_states = False, # Whether the model returns all hidden-states.
)

# Tell pytorch to run this model on the GPU.
model.cuda()

为了好奇，我们可以在这里按名称浏览所有模型的参数。

在下面的单元格中，我打印出了权重的名称和尺寸，分别为。

嵌入层。
十二个变压器中的第一个。
输出层。

# Get all of the model's parameters as a list of tuples.
params = list(model.named_parameters())

print('The BERT model has {:} different named parameters.\n'.format(len(params)))

print('==== Embedding Layer ====\n')

for p in params[0:5]:
    print("{:<55} {:>12}".format(p[0], str(tuple(p[1].size()))))

print('\n==== First Transformer ====\n')

for p in params[5:21]:
    print("{:<55} {:>12}".format(p[0], str(tuple(p[1].size()))))

print('\n==== Output Layer ====\n')

for p in params[-4:]:
    print("{:<55} {:>12}".format(p[0], str(tuple(p[1].size()))))

4.2. 优化器 & 学习率调度器

现在我们已经加载了我们的模型，我们需要从存储的模型中抓取训练超参数。

为了微调的目的，作者建议从以下数值中选择（来自BERT论文的附录A.3）。

batch大小： 16，32。
学习率(Adam)： 5e-5、3e-5、2e-5。
epoch数： 2、3、4。

我们选择的是： * batch大小：32（在创建DataLoaders时设置）。 * 学习率：2e-5 * Epochs: 4 (我们将看到这可能是太多了...)

epsilon 参数eps = 1e-8是 "一个非常小的数字，以防止在实现中出现任何除以零的情况" (来自这里)。

你可以在run_glue.py这里中找到AdamW优化器的创建。

# Note: AdamW is a class from the huggingface library (as opposed to pytorch) 
# I believe the 'W' stands for 'Weight Decay fix"
optimizer = AdamW(model.parameters(),
                  lr = 2e-5, # args.learning_rate - default is 5e-5, our notebook had 2e-5
                  eps = 1e-8 # args.adam_epsilon  - default is 1e-8.
                )

from transformers import get_linear_schedule_with_warmup

# Number of training epochs. The BERT authors recommend between 2 and 4. 
# We chose to run for 4, but we'll see later that this may be over-fitting the
# training data.
epochs = 4

# Total number of training steps is [number of batches] x [number of epochs]. 
# (Note that this is not the same as the number of training samples).
total_steps = len(train_dataloader) * epochs

# Create the learning rate scheduler.
scheduler = get_linear_schedule_with_warmup(optimizer, 
                                            num_warmup_steps = 0, # Default value in run_glue.py
                                            num_training_steps = total_steps)

4.3. 训练循环

下面是我们的训练循环。有很多事情要做，但从根本上讲，我们的循环中的每一个过程都有一个训练阶段和一个验证阶段。

*感谢Stas Bekman贡献了使用验证损失来检测过度拟合的见解和代码！

训练： - 解开我们的数据输入和标签 - 将数据加载到GPU上进行加速 - 清空上一次计算的梯度。 - 在pytorch中，默认情况下梯度会累积（对RNNs等有用），除非你明确地清除它们。 - 正向传递（通过网络输入数据）。 - 后传(反向传播) - 用optimizer.step()告诉网络更新参数。 - 跟踪监测进展的变量

验证： - 解开我们的数据输入和标签 - 将数据加载到GPU上进行加速 - 正向传递(通过网络输入数据) - 计算我们的验证数据的损失，并跟踪监测进度的变量。

Pytorch 向我们隐藏了所有的详细计算，但我们已经对代码进行了注释，以指出上述步骤中的每一行都在进行。

PyTorch也有一些初学者教程，你可能也会觉得很有帮助。

定义一个用于计算精度的辅助函数。

import numpy as np

# Function to calculate the accuracy of our predictions vs labels
def flat_accuracy(preds, labels):
    pred_flat = np.argmax(preds, axis=1).flatten()
    labels_flat = labels.flatten()
    return np.sum(pred_flat == labels_flat) / len(labels_flat)

用于格式化 "hh:mm:ss" 的经过时间的辅助函数。

import time
import datetime

def format_time(elapsed):
    '''
    Takes a time in seconds and returns a string hh:mm:ss
    '''
    # Round to the nearest second.
    elapsed_rounded = int(round((elapsed)))
    
    # Format as hh:mm:ss
    return str(datetime.timedelta(seconds=elapsed_rounded))

我们准备开始训练了!

import random

# This training code is based on the `run_glue.py` script here:
# https://github.com/huggingface/transformers/blob/5bfcd0485ece086ebcbed2d008813037968a9e58/examples/run_glue.py#L128

# Set the seed value all over the place to make this reproducible.
seed_val = 42

random.seed(seed_val)
np.random.seed(seed_val)
torch.manual_seed(seed_val)
torch.cuda.manual_seed_all(seed_val)

# We'll store a number of quantities such as training and validation loss, 
# validation accuracy, and timings.
training_stats = []

# Measure the total training time for the whole run.
total_t0 = time.time()

# For each epoch...
for epoch_i in range(0, epochs):
    
    # ========================================
    #               Training
    # ========================================
    
    # Perform one full pass over the training set.
    
    print("")
    print('======== Epoch {:} / {:} ========'.format(epoch_i + 1, epochs))
    print('Training...')
    
    # Measure how long the training epoch takes.
    t0 = time.time()
    
    # Reset the total loss for this epoch.
    total_train_loss = 0
    
    # Put the model into training mode. Don't be mislead--the call to 
    # `train` just changes the *mode*, it doesn't *perform* the training.
    # `dropout` and `batchnorm` layers behave differently during training
    # vs. test (source: https://stackoverflow.com/questions/51433378/what-does-model-train-do-in-pytorch)
    model.train()
    
    # For each batch of training data...
    for step, batch in enumerate(train_dataloader):
    
        # Progress update every 40 batches.
        if step % 40 == 0 and not step == 0:
            # Calculate elapsed time in minutes.
            elapsed = format_time(time.time() - t0)
            
            # Report progress.
            print('  Batch {:>5,}  of  {:>5,}.    Elapsed: {:}.'.format(step, len(train_dataloader), elapsed))
    
        # Unpack this training batch from our dataloader. 
        #
        # As we unpack the batch, we'll also copy each tensor to the GPU using the 
        # `to` method.
        #
        # `batch` contains three pytorch tensors:
        #   [0]: input ids 
        #   [1]: attention masks
        #   [2]: labels 
        b_input_ids = batch[0].to(device)
        b_input_mask = batch[1].to(device)
        b_labels = batch[2].to(device)
    
        # Always clear any previously calculated gradients before performing a
        # backward pass. PyTorch doesn't do this automatically because 
        # accumulating the gradients is "convenient while training RNNs". 
        # (source: https://stackoverflow.com/questions/48001598/why-do-we-need-to-call-zero-grad-in-pytorch)
        model.zero_grad()        
    
        # Perform a forward pass (evaluate the model on this training batch).
        # The documentation for this `model` function is here: 
        # https://huggingface.co/transformers/v2.2.0/model_doc/bert.html#transformers.BertForSequenceClassification
        # It returns different numbers of parameters depending on what arguments
        # arge given and what flags are set. For our useage here, it returns
        # the loss (because we provided labels) and the "logits"--the model
        # outputs prior to activation.
        loss, logits = model(b_input_ids, 
                             token_type_ids=None, 
                             attention_mask=b_input_mask, 
                             labels=b_labels)
    
        # Accumulate the training loss over all of the batches so that we can
        # calculate the average loss at the end. `loss` is a Tensor containing a
        # single value; the `.item()` function just returns the Python value 
        # from the tensor.
        total_train_loss += loss.item()
    
        # Perform a backward pass to calculate the gradients.
        loss.backward()
    
        # Clip the norm of the gradients to 1.0.
        # This is to help prevent the "exploding gradients" problem.
        torch.nn.utils.clip_grad_norm_(model.parameters(), 1.0)
    
        # Update parameters and take a step using the computed gradient.
        # The optimizer dictates the "update rule"--how the parameters are
        # modified based on their gradients, the learning rate, etc.
        optimizer.step()
    
        # Update the learning rate.
        scheduler.step()
    
    # Calculate the average loss over all of the batches.
    avg_train_loss = total_train_loss / len(train_dataloader)            
    
    # Measure how long this epoch took.
    training_time = format_time(time.time() - t0)
    
    print("")
    print("  Average training loss: {0:.2f}".format(avg_train_loss))
    print("  Training epcoh took: {:}".format(training_time))
        
    # ========================================
    #               Validation
    # ========================================
    # After the completion of each training epoch, measure our performance on
    # our validation set.
    
    print("")
    print("Running Validation...")
    
    t0 = time.time()
    
    # Put the model in evaluation mode--the dropout layers behave differently
    # during evaluation.
    model.eval()
    
    # Tracking variables 
    total_eval_accuracy = 0
    total_eval_loss = 0
    nb_eval_steps = 0
    
    # Evaluate data for one epoch
    for batch in validation_dataloader:
        
        # Unpack this training batch from our dataloader. 
        #
        # As we unpack the batch, we'll also copy each tensor to the GPU using 
        # the `to` method.
        #
        # `batch` contains three pytorch tensors:
        #   [0]: input ids 
        #   [1]: attention masks
        #   [2]: labels 
        b_input_ids = batch[0].to(device)
        b_input_mask = batch[1].to(device)
        b_labels = batch[2].to(device)
        
        # Tell pytorch not to bother with constructing the compute graph during
        # the forward pass, since this is only needed for backprop (training).
        with torch.no_grad():        
    
            # Forward pass, calculate logit predictions.
            # token_type_ids is the same as the "segment ids", which 
            # differentiates sentence 1 and 2 in 2-sentence tasks.
            # The documentation for this `model` function is here: 
            # https://huggingface.co/transformers/v2.2.0/model_doc/bert.html#transformers.BertForSequenceClassification
            # Get the "logits" output by the model. The "logits" are the output
            # values prior to applying an activation function like the softmax.
            (loss, logits) = model(b_input_ids, 
                                   token_type_ids=None, 
                                   attention_mask=b_input_mask,
                                   labels=b_labels)
            
        # Accumulate the validation loss.
        total_eval_loss += loss.item()
    
        # Move logits and labels to CPU
        logits = logits.detach().cpu().numpy()
        label_ids = b_labels.to('cpu').numpy()
    
        # Calculate the accuracy for this batch of test sentences, and
        # accumulate it over all batches.
        total_eval_accuracy += flat_accuracy(logits, label_ids)


    # Report the final accuracy for this validation run.
    avg_val_accuracy = total_eval_accuracy / len(validation_dataloader)
    print("  Accuracy: {0:.2f}".format(avg_val_accuracy))
    
    # Calculate the average loss over all of the batches.
    avg_val_loss = total_eval_loss / len(validation_dataloader)
    
    # Measure how long the validation run took.
    validation_time = format_time(time.time() - t0)
    
    print("  Validation Loss: {0:.2f}".format(avg_val_loss))
    print("  Validation took: {:}".format(validation_time))
    
    # Record all statistics from this epoch.
    training_stats.append(
        {
            'epoch': epoch_i + 1,
            'Training Loss': avg_train_loss,
            'Valid. Loss': avg_val_loss,
            'Valid. Accur.': avg_val_accuracy,
            'Training Time': training_time,
            'Validation Time': validation_time
        }
    )

print("")
print("Training complete!")

print("Total training took {:} (h:mm:ss)".format(format_time(time.time()-total_t0)))

我们来看看训练过程的总结。

import pandas as pd

# Display floats with two decimal places.
pd.set_option('precision', 2)

# Create a DataFrame from our training statistics.
df_stats = pd.DataFrame(data=training_stats)

# Use the 'epoch' as the row index.
df_stats = df_stats.set_index('epoch')

# A hack to force the column headers to wrap.
#df = df.style.set_table_styles([dict(selector="th",props=[('max-width', '70px')])])

# Display the table.
print(df_stats)

请注意，虽然训练损失随着时间的推移在下降，但验证损失却在增加！这说明我们的模型训练时间过长，对训练数据的拟合过度。

作为参考，我们使用的是7695个训练样本和856个验证样本）。

验证损失是一个比准确率更精确的衡量标准，因为对于准确率，我们并不关心准确的输出值，而只是关心它落在阈值的哪一边。

如果我们预测的答案是正确的，但置信度较低，那么验证损失会抓住这一点，而准确性则不会。

# Commented out IPython magic to ensure Python compatibility.
import matplotlib.pyplot as plt
# % matplotlib inline

import seaborn as sns

# Use plot styling from seaborn.
sns.set(style='darkgrid')

# Increase the plot size and font size.
sns.set(font_scale=1.5)
plt.rcParams["figure.figsize"] = (12,6)

# Plot the learning curve.
plt.plot(df_stats['Training Loss'], 'b-o', label="Training")
plt.plot(df_stats['Valid. Loss'], 'g-o', label="Validation")

# Label the plot.
plt.title("Training & Validation Loss")
plt.xlabel("Epoch")
plt.ylabel("Loss")
plt.legend()
plt.xticks([1, 2, 3, 4])

plt.show()

5. 测试集的性能

现在，我们将加载保持数据集，并准备输入，就像我们对训练集所做的那样。然后我们将使用Matthew's correlation coefficient来评估预测，因为这是广大NLP社区用来评估CoLA性能的度量。通过这个指标，+1是最好的分数，-1是最差的分数。通过这种方式，我们可以看到我们在这个特定任务上与最先进模型的表现。

5.1. 数据准备

我们需要应用所有与训练数据相同的步骤来准备我们的测试数据集。

import pandas as pd

# Load the dataset into a pandas dataframe.
df = pd.read_csv("./cola_public/raw/out_of_domain_dev.tsv", delimiter='\t', header=None, names=['sentence_source', 'label', 'label_notes', 'sentence'])

# Report the number of sentences.
print('Number of test sentences: {:,}\n'.format(df.shape[0]))

# Create sentence and label lists
sentences = df.sentence.values
labels = df.label.values

# Tokenize all of the sentences and map the tokens to thier word IDs.
input_ids = []
attention_masks = []

# For every sentence...
for sent in sentences:
    # `encode_plus` will:
    #   (1) Tokenize the sentence.
    #   (2) Prepend the `[CLS]` token to the start.
    #   (3) Append the `[SEP]` token to the end.
    #   (4) Map tokens to their IDs.
    #   (5) Pad or truncate the sentence to `max_length`
    #   (6) Create attention masks for [PAD] tokens.
    encoded_dict = tokenizer.encode_plus(
                        sent,                      # Sentence to encode.
                        add_special_tokens = True, # Add '[CLS]' and '[SEP]'
                        max_length = 64,           # Pad & truncate all sentences.
                        pad_to_max_length = True,
                        return_attention_mask = True,   # Construct attn. masks.
                        return_tensors = 'pt',     # Return pytorch tensors.
                   )
    
    # Add the encoded sentence to the list.    
    input_ids.append(encoded_dict['input_ids'])
    
    # And its attention mask (simply differentiates padding from non-padding).
    attention_masks.append(encoded_dict['attention_mask'])

# Convert the lists into tensors.
input_ids = torch.cat(input_ids, dim=0)
attention_masks = torch.cat(attention_masks, dim=0)
labels = torch.tensor(labels)

# Set the batch size.  
batch_size = 32  

# Create the DataLoader.
prediction_data = TensorDataset(input_ids, attention_masks, labels)
prediction_sampler = SequentialSampler(prediction_data)
prediction_dataloader = DataLoader(prediction_data, sampler=prediction_sampler, batch_size=batch_size)

5.2. 测试集上进行评估

准备好了测试集，我们就可以应用我们的微调模型对测试集产生预测。

# Prediction on test set

print('Predicting labels for {:,} test sentences...'.format(len(input_ids)))

# Put model in evaluation mode
model.eval()

# Tracking variables 
predictions , true_labels = [], []

# Predict 
for batch in prediction_dataloader:
  # Add batch to GPU
  batch = tuple(t.to(device) for t in batch)

  # Unpack the inputs from our dataloader
  b_input_ids, b_input_mask, b_labels = batch

  # Telling the model not to compute or store gradients, saving memory and 
  # speeding up prediction
  with torch.no_grad():
      # Forward pass, calculate logit predictions
      outputs = model(b_input_ids, token_type_ids=None, 
                      attention_mask=b_input_mask)

  logits = outputs[0]

  # Move logits and labels to CPU
  logits = logits.detach().cpu().numpy()
  label_ids = b_labels.to('cpu').numpy()

  # Store predictions and true labels
  predictions.append(logits)
  true_labels.append(label_ids)

print('DONE.')

使用"Matthews correlation coefficient"来衡量CoLA基准的准确性。(MCC)。

我们在这里用MCC是因为班级不平衡。

print('Positive samples: %d of %d (%.2f%%)' % (df.label.sum(), len(df.label), (df.label.sum() / len(df.label) * 100.0)))

from sklearn.metrics import matthews_corrcoef

matthews_set = []

# Evaluate each test batch using Matthew's correlation coefficient
print('Calculating Matthews Corr. Coef. for each batch...')

# For each input batch...
for i in range(len(true_labels)):
    # The predictions for this batch are a 2-column ndarray (one column for "0" 
    # and one column for "1"). Pick the label with the highest value and turn this
    # in to a list of 0s and 1s.
    pred_labels_i = np.argmax(predictions[i], axis=1).flatten()

    # Calculate and store the coef for this batch.  
    matthews = matthews_corrcoef(true_labels[i], pred_labels_i)                
    matthews_set.append(matthews)

最后的分数将基于整个测试集，但我们来看看各个 batch 的分数，以了解各 batch 之间指标的差异性。

每个批次都有 32 个句子，除了最后一个 batch 只有 (516 % 32)=4 个测试句子。

# Create a barplot showing the MCC score for each batch of test samples.
ax = sns.barplot(x=list(range(len(matthews_set))), y=matthews_set, ci=None)

plt.title('MCC Score per Batch')
plt.ylabel('MCC Score (-1 to +1)')
plt.xlabel('Batch #')

plt.show()

现在我们将综合所有批次的结果，计算出我们最终的MCC分数。

# Combine the results across all batches. 
flat_predictions = np.concatenate(predictions, axis=0)

# For each sample, pick the label (0 or 1) with the higher score.
flat_predictions = np.argmax(flat_predictions, axis=1).flatten()

# Combine the correct labels for each batch into a single list.
flat_true_labels = np.concatenate(true_labels, axis=0)

# Calculate the MCC
mcc = matthews_corrcoef(flat_true_labels, flat_predictions)

print('Total MCC: %.3f' % mcc)

酷! 在大约半小时内，在不做任何超参数调整（调整学习率、epochs、批次大小、ADAM属性等）的情况下，我们能够得到一个不错的分数。

*注意：为了最大限度地提高分数，我们应该删除 "验证集"（我们用它来帮助确定要训练多少个epochs），并对整个训练集进行训练。

库中记录了这个基准的预期精度这里为49.23。

你也可以看看官方的排行榜这里。

请注意，(由于数据集规模较小?)运行之间的准确率可能会有很大差异。

结论

本篇文章演示了利用预先训练好的 BERT 模型，无论你对哪个具体的 NLP 任务感兴趣，你都可以使用 pytorch 接口以最小的努力和训练时间快速有效地创建一个高质量的模型。

最具性价比的4K显示器？创维28U1显示器使用体验

2020-05-29T10:48:29.000Z

2020年5月10日晚，IT之家发出了这样一篇文章创维推出高性价比28英寸4K显示器：HDR10/Type-C，1399元。IPS、广色域、28寸。。。评论区立刻炸了锅，一分钱一分货，大家都在猜测这款显示器究竟在哪些地方“偷工减料”才能达到如此性价比。本文来探究一下这款显示器究竟是不是最具性价比的4K显示器。

外观

显示器是上左右三窄边框设计，窄边框约7mm，虽然比之前用的戴尔显示器边框稍宽一些，但是在28寸的屏幕上看起来很协调。显示器底座是一块厚重的矩形金属板，看起来非常简洁。显示器支持壁挂，支架支持快拆，并且支架可以上下左右俯仰调节，但是不支持旋转为竖屏。此处预售时放了竖屏的宣传图，后来才改了宣传图并添加了竖屏支架需单独购买的小字。说实话28寸显示器竖起来实在是太高了，但是误导宣传实在没必要。

接口方面由一个HDMI 2.0，一个DP 1.2，一个Type-C，两个USB 2.0和一个音频接口组成。其中两个USB2.0接口比较鸡肋，因为没有USB的上行接口，所以只有在Type-C接口接上支持云电脑的手机后才可以使用。Type-C接口好评，对于一些只有Type-C接口的笔记本电脑来说可以不用转接头了，但是看评论好像Type-C只支持30HZ的刷新率。同时还支持15W的反向充电，充手机足够了。显示器还附带了DP线和Type-C线，质量都很不错。不过显示器电源是外置的，大砖头差评。

这块面板还支持HDR10，不过最大亮度只有300 cd/m2，只是支持播放HDR视频，对HDR效果就不要有太多期待了。显示器还有2*2W的音响，音质就不用考虑了，聊胜于无。

颜色表现

博主在网上租了爱色丽i1 pro较色仪对屏幕进行校色，色域和色准表现结果如下。

P3色域只有84%，没有达到宣传的90%。△E结果最大值为1.11，小于宣传的△E<3。以上测试为爱色丽+DisplayCAL的测试结果，由于博主第一次使用较色仪，可能操作有误，不保证结果一定正确。校色文件稍后放出。

坏点

很不幸，博主购买的这块显示器有一个坏点，如下图绿点所示。应该是这个绿色像素点无法控制亮暗，在显示灰色的时候尤其明显。不过由于是4K分辨率，坏点很小以至于使用的第二天才发现，和客服聊了聊是允许退换货的，看起来不影响使用也就不退了。

漏光

IPS面板难免会有一定的漏光，我对这款显示器的漏光水平还是比较满意的。具体对比如下图，均为黑天关灯后拍摄。

上述所有图片的ISO均是250，与人眼观察较为一致，可见显示器四周发暗，但基本不影响使用。

当将ISO拉高到2500时效果如上图所示，可见四周漏光仍然明显，当然IPS面板多少都会有漏光现象，并不影响正常使用。

与其他面板对比

进入工厂模式我们可以看到该显示器使用的是群创的 M280DCA-E3B 面板。我们将其与京东方的 MV270QUM-N20 面板进行对比，该面板常用在三千价位以上的27寸4K的IPS显示器（戴尔 U2718Q、明基 PD2700U 等）

基本信息	群创 M280DCA-E3B（创维28U1）	京东方 MV270QUM-N20
面板尺寸	28.0（英寸）	27.0（英寸）
面板亮度	300 cd/m2	350 cd/m2
NTSC 比值	84% NTSC	79% NTSC
Adobe 覆盖率	82%	81%
DCI-P3 覆盖率	86%	82%
响应时间	4 ms	5 ms
对比度	1000：1	1300：1

通过比较我们发现，创维28U1 使用的这块群创面板在色域方面比三千价位的4K显示器更广，但是在亮度以及对比度等方面，京东方 MV270QUM-N20 参数更好一些。也就是说作为入门4K显示器，这块面板是及格的，并没有明显的偏科。

与使用相同面板的显示器对比

同时使用这块群创面板的还可能有 联想 S28u，三星 U28R550，宏碁 VG280K，飞利浦 288E2E 等显示器。之所以是可能是因为博主并没有证据证明他们的面板相同，但是据我所知28寸4K的IPS显示器目前只有群创这一款面板。在使用相同面板的情况下，不同厂家的显示器主要区别主要是驱动板用料、出厂校色、品牌售后等地方下功夫。对比结果如下表所示。

显示器名称	京东最低价	画中画	△E	接口	质保	亮度
创维 28U1	1399	不支持	<3	HDMI+DP+typeC	3年	300
联想 S28u	2499	不支持	?	HDMI+DP	1年	300
三星 U28R550	1999	支持	?	HDMI*2+DP	1年	300
宏碁 VG280K	1999	不支持	?	HDMI*2+DP	3年	300
飞利浦 288E2E	1799	支持	<2	HDMI*2+DP	3年	300
华硕 VG289Q	1999	不支持	？	HDMI*2+DP	3年	350

除了华硕亮度达到350cd/m2，其余显示器都是300cd/m2。创维28u1以较低的价格，不错的配置，可以说是性价比非常不错的选择了。

总结

创维在价格上十分具有优势，但是在一些细节上仍需打磨，如可能没有出厂校色，亮屏较慢，屏幕坏点控制等。对于产品来说，创维28U1这款显示器无疑是值得购买的，作为先上车的我来说非常满意。但对于宣传角度来说，无疑是失败的，尤其是在预售时的参数与实际购买的参数差距较大，比如△E由小于2改成了小于3，宣传可以竖屏写代码但支架需单独购买，宣传支持画中画又删除此功能。

这在品牌口碑上尤其不利，希望以后厂商注意。

四路 RTX2080Ti 深度学习服务器配置

2019-11-07T10:48:29.000Z

实验室准备新配一台四路 RTX2080Ti 的深度学习服务器。为了报销方便，没有选择供应商，而是选择在京东自营购买。本文详细介绍了配置服务器的过程。后续的系统安装可以参考本人的这篇博客：使用 LXD 搭建多人使用的 GPU 服务器

配置

博主在购买之前在知乎提了一个问题，得到了很有用的帮助。下面是具体配置：

类别	品牌	数量	单价	总价
GPU	技嘉RTX2080Ti TURBO 11G	4	9999	39996
CPU	i9-9820X 10/20	1	6299	6299
主板	技嘉 X299-WU8	1	4999	4999
机箱	先马掠食者V1	1	999	999
内存	美商海盗船复仇者LPX DDR4 3000 16GB	8	579	4632
电源	振华额定2000W LEADEX P 2000电源	1	3299	3299
NVME SSD	三星 1TB SSD固态硬盘 970 EVO	1	1699	1699
SATA SSD	三星 1TB SSD固态硬盘 860 EVO	1	1029	1029
CPU 散热	美商海盗船 H150i PRO	1	1299	1299
-	-	-	-	64251

其实配置的关键就是 GPU、CPU和主板的选择。

显卡选择

博主是2019年10月选择的配置，目前最具有性价比的显卡依然是 RTX2080Ti，图灵架构可以在混合精度运算时大幅度提升性能，缺点是显存较小，只有 11 GB

GPU 在确定是 RTX2080Ti 后就非常好选择了。注意多卡服务器必须是单风扇的涡轮版显卡，因为涡轮散热空气从头进入，热气从尾排出，多张卡互不影响。但是多风扇轴式散热是从下方吸入空气，侧面排出，如果是多卡排出的热气又被上卡吸进去，导致上卡温度爆炸，降频严重。下图可以理解涡轮风扇的风道。

CPU与主板选择

CPU与主板的选择无非就是Intel和AMD的选择，每家又分为民用级和服务器级，这里我选择的是Intel的民用级i9-9820X。AMD的线程撕裂者性价比更高，但可能坑多一些。服务器级的CPU以及主板一般需要经销商采购，区别主要是支持ECC的内存更稳定，京东自营一般不卖，所以没有考虑。

CPU 散热器选择

CPU散热器这里选择的是美商海盗船 H150i PRO 360一体水冷。一开始选择的是猫头鹰的风冷，但是由于个头太大，装上后散热块会和显卡背面金属触点接触（显卡没有背板），怕引起短路等问题，最终更换成一体水冷。

电源选择

由于显卡满载就需要至少1000W的功率，再加上CPU内存硬盘，1600W按道理是足够了，为了稳妥选择了振华的2000W电源。需要注意的是这块电源的插头是10A的空调插头，需要买个转接的插线板。

散热问题

服务器已经稳定运行了半年多，散热问题还是有必要提一下。虽然机箱装满了4个机箱风扇以及3个一体水冷的风扇，显卡也是机器学习专供的涡轮版可以及时将热气排到机箱外，但是由于机箱放置在只开着一扇窗户的小机房里，导致机房温度骤升（机箱的铁板烫的不敢用手摸）。最终在窗户上加上排气扇解决。四块显卡满载情况下，最下面的显卡温度控制最好，在76度左右，剩下的三块显卡均达到82度，可能碰到了功耗墙。

总结

本次装机除显卡为天猫旗舰店购买外，其余均在京东自营购买。如果下次还有机会重组一套配置的话，显卡的显存会尽可能换大一些的，CPU会尝试使用AMD，可能的话选择水冷（风险和维护成本有点高）。

AttributeError:'NoneType' object has no attribute 'clone'

2019-10-24T08:15:28.000Z

在使用 PyTorch 计算 Tensor 的梯度时遇到了这个问题。

Debug 查看是因为 Tensor 的 is_leaf 是 False，说明无法求梯度

解决办法是 Tenso



ImageNet 训练集特殊图像集合
2019-10-20T01:56:07.000Z
最近运行一个 PyTorch 工程的代码，在读取数据集时没有用官方的 Dataloader，而是自己写了一个读取数据集的函数。在读取 ImageNet 2012 数据集时遇到了一些错误，在此记录一下。
n02105855_2933.JPEG 其实是 PNG 图像
在使用 cv2 读取数据集并将其馈送到 model(data) 时，如果没有对data进行检验，就有可能报下面的错误
RuntimeError: Given groups=1, weight of size 64 3 7 7, expected input[1, 4, 224, 224] to have 3 channels, but got 4 channels instead
或者
RuntimeError: invalid argument 0: Sizes of tensors must match except in dimension 0. Got 3 and 4 in dimension 1 at /tmp/pip-req-build-58y_cjjl/aten/src/TH/generic/THTensor.cpp:689
这是因为训练集中有一个图片是 PNG 图片，强行将后缀名改为了 .JPEG，但还是保留了 PNG 图像的 4 通道（PNG图像除了 RGB 三通道外还有一个 Alpha 通道，表示图像的透明度）
这个图片就是 n02105855_2933.JPEG
n04152593_17460.JPEG 其实是 HEIC 图像
这个图片在读取时没有报错，但会报 warning。
CMYK 图像
JPEG 图像分两种，一种 RGB，一种 CMYK，下面是 CMYK 的图像列表：
n01739381_1309.JPEG
n02077923_14822.JPEG
n02447366_23489.JPEG
n02492035_15739.JPEG
n02747177_10752.JPEG
n03018349_4028.JPEG
n03062245_4620.JPEG
n03347037_9675.JPEG
n03467068_12171.JPEG
n03529860_11437.JPEG
n03544143_17228.JPEG
n03633091_5218.JPEG
n03710637_5125.JPEG
n03961711_5286.JPEG
n04033995_2932.JPEG
n04258138_17003.JPEG
n04264628_27969.JPEG
n04336792_7448.JPEG
n04371774_5854.JPEG
n04596742_4225.JPEG
n07583066_647.JPEG
n13037406_4650.JPEG
当你在读取 ImageNet 2012 训练集遇到问题时，可以先尝试使用验证集进行训练，确认不是程序问题，而是训练集问题时，可以尝试删除或替换上述图像。


ICT 实验室深度学习服务器使用说明
2019-10-10T07:55:36.000Z
实验室新到的服务器已经配置完成。为了满足实验室所有同学的实验需求，同时最大化服务器的利用率，故为每位同学分配一个 LXD 容器，每个容器一个内网 IP。本文将详细介绍服务器的使用方式。
服务器配置介绍
类型 型号 数量
GPU 技嘉RTX2080Ti TURBO 11G 4
CPU i9-9820X 10核/20线程 1
CPU散热 美商海盗船 H150i PRO 1
主板 技嘉 X299-WU8 1
机箱 先马掠食者V1 1
内存 美商海盗船 复仇者LPX DDR4 3000 16GB 8
电源 振华 额定2000W LEADEX P 2000电源 1
PCIE固态硬盘 三星 1TB SSD固态硬盘 970 EVO 1
SATA固态硬盘 三星 1TB SSD固态硬盘 860 EVO 1
为什么选择 LXD
LXD 就是一个提供了 REST API 的 LXC 容器管理器。 LXD 最主要的目标就是使用 Linux 容器而不是硬件虚拟化向用户提供一种接近虚拟机的使用体验。
其优势是
容器中的系统与宿主机使用同一个内核，性能损耗小；
容器可以使用宿主机的所有计算资源；
容器重启速度达到秒级；
轻量级隔离，在隔离的同时还提供共享机制，以实现容器与宿主机的资源共享。
使用 LXD，相当于每个人都拥有一台独立的服务器，运行环境互相隔离，例如可以安装不同的 CUDA 版本或 cuDNN 版本。（容器的显卡驱动必须和宿主机显卡驱动版本号相同，故不能改变）
目前每一个容器都已经安装好了显卡驱动，并分配了内网 IP，可以直接使用 SSH 进行远程登录。主目录有一个 share 共享目录，用于存放公用数据集、安装包、模型等共享资源。
连接 LXD 容器
目前使用 LXDUI 统一管理容器，地址为 http://192.168.100.230:15151 进入后界面如下，可以对自己的容器进行 IP 查询以及快照管理。
lxdui
找到自己的 IP 后就可以使用 SSH 工具进行远程连接，默认用户名为你的姓氏，例如登录 IP 为 192.168.100.111，名为 zhangsan，则输入下述命令进行连接：
ssh zhang@192.168.100.111
登录成功后可更改用户名和密码：
# 更改用户名
usermod -l  -d /home/ -m 
groupmod -n  

# 更改密码
passwd 
安装 Python 环境
这里介绍使用 Anaconda 进行 Python 环境的配置。
1.输入下述命令安装 Anaconda（不要加 sudo）：
bash ~/share/install/Anaconda3-2019.07-Linux-x86_64.sh
其中最后一步 Init 为 yes，这样会在 ~/.bashrc 文件的最后添加初始化信息。
2.运行下述命令更新 .bashrc
source ~/.bashrc
更新后命令行前出现 (bash) 说明安装成功。
3.更换 Anaconda 源
由于 Anaconda 服务器在国外，换国内源可以加快下载速度。我在实验室搭建了 Anaconda 的本地镜像，本地 Anaconda 镜像的搭建可参考本人博客 搭建本地 Anaconda 镜像。输入下述命令更换为实验室镜像（更新可能不及时）：
conda config --add channels http://192.168.100.188/pkgs/free/
conda config --add channels http://192.168.100.188/pkgs/main/
conda config --set show_channel_urls yes
也可以使用清华源，参考https://mirror.tuna.tsinghua.edu.cn/help/anaconda/
4.创建 Anaconda 环境
例如，我们想创建名为 “pytorch” 的 PyTorch 环境，则可以运行下述命令：
conda create -n "pytorch" pytorch
这样将安装 PyTorch 的最新版本。若想安装某个特定的版本，可以在后面加 =1.0。
注意，使用 Anaconda 安装深度学习框架如 PyTorch 或 TensorFlow 时会自动安装 CUDA 和 cuDNN，并且会对深度学习框架进行优化，如果没有特殊需求则不需要再安装 CUDA 和 cuDNN。当然也可以安装（如编译安装 apex）。
输入下述命令进入刚才创建的 PyTorch 环境：
conda activate pytorch
之后可以使用 conda install xxx 或 pip install xxx 安装 Python 包。
使用 PyCharm IDE 远程连接 Python 环境
PyCharm IDE 必须是专业版 (Professional)，如果是社区版 (Community) 需到 官网 下载专业版。
学生可通过咱学校的 edu 邮箱免费激活，激活教程在此
PyCharm 远程调试的教程有很多，随便找了一个 使用PyCharm进行远程开发和调试
硬件监控
在训练时，我们需要实时监控硬件的变化，如 GPU 的显存，占用率等。使用 nvidia-smi 命令可查看显存和占用率等使用状态，如下图所示。
nvidia_smi
一般来说，显存和占用率越高，训练速度越快。
使用下述命令可以每 0.1 秒刷新一次界面：
watch -n 0.1 nvidia-smi
使用下述网址可通过 NetData 监控硬件信息：
http://192.168.100.230:19999/#menu_nv_submenu_Load;theme=slate;help=true
效果如图：
netdata


超详细! Ubuntu 18.04 安装 NVIDIA 显卡驱动
2019-10-08T11:24:25.000Z
最近给实验室服务器安装系统，多次因为显卡驱动的问题而崩溃。。在此整理一下显卡驱动的安装。
查看显卡型号
不知道显卡型号的可以通过此命令查看，但可能有的新显卡无法识别。
lspci | grep VGA
下载显卡驱动程序
在 NVIDIA 官网 或 GeForce 官网 下载所需的显卡驱动程序。
需要注意的是显卡驱动需要和 CUDA 版本对应，而 CUDA 版本又要和 PyTorch 或 TensorFlow 的版本对应，所以原则上是越新的版本越好，因为可以支持更多版本的深度学习框架。
禁用 nouveau 驱动
1.使用下述命令可以查看 nouveau 驱动是否运行：
lsmod | grep nouveau
若出现下述结果：
nouveau              1863680  9
video                  49152  1 nouveau
ttm                   102400  1 nouveau
mxm_wmi                16384  1 nouveau
drm_kms_helper        180224  1 nouveau
drm                   479232  12 drm_kms_helper,ttm,nouveau
i2c_algo_bit           16384  2 igb,nouveau
wmi                    28672  4 intel_wmi_thunderbolt,wmi_bmof,mxm_wmi,nouveau
说明 nouveau 驱动正在运行。
2.运行下述命令禁用该驱动：
sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
检查命令是否正确：
cat /etc/modprobe.d/blacklist-nvidia-nouveau.conf
若出现下述结果说明命令正确：
blacklist nouveau
options nouveau modeset=0
3.更新设置并重启：
sudo update-initramfs -u
sudo reboot
4.重启后重新输入下述命令：
lsmod | grep nouveau
若没有任何输出说明禁用 nouveau 驱动成功
安装 NVIDIA 显卡驱动
1.安装依赖：
sudo apt install gcc g++ make
2.登录时按 ctrl + alt + F2 进入命令行并使用用户名密码登录，并输入 sudo telinit 3 打开一个新的 TTY1 界面。如果是 SSH 远程连接，则不需要做上述步骤。
3.安装驱动：
sudo bash ./NVIDIA-Linux-x86_64-418.56.run
并按下述选项选择：
4.安装成功后输入 nvidia-smi，若有类似下述输出证明显卡安装成功：
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 418.56       Driver Version: 418.56       CUDA Version: 10.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce RTX 208...  Off  | 00000000:19:00.0 Off |                  N/A |
| 52%   57C    P0    59W / 250W |      0MiB / 10989MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   1  GeForce RTX 208...  Off  | 00000000:1A:00.0 Off |                  N/A |
| 73%   70C    P0    73W / 250W |      0MiB / 10989MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
|   2  GeForce RTX 208...  Off  | 00000000:67:00.0 Off |                  N/A |
| 79%   71C    P0    86W / 250W |      0MiB / 10989MiB |      1%      Default |
+-------------------------------+----------------------+----------------------+
|   3  GeForce RTX 208...  Off  | 00000000:68:00.0 Off |                  N/A |
| 44%   71C    P0     1W / 250W |      0MiB / 10986MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+
20230327更新
其实安装显卡驱动有更简单的方法，不用禁用 nouveau 驱动。
安装NVIDIA显卡驱动
ubuntu-drivers devices
输出 
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd000025A2sv00001558sd0000866Dbc03sc00i00
vendor   : NVIDIA Corporation
driver   : nvidia-driver-515-open - distro non-free
driver   : nvidia-driver-515-server - distro non-free
driver   : nvidia-driver-470-server - distro non-free
driver   : nvidia-driver-525 - distro non-free
driver   : nvidia-driver-470 - distro non-free
driver   : nvidia-driver-515 - distro non-free
driver   : nvidia-driver-525-open - distro non-free recommended
driver   : nvidia-driver-510 - distro non-free
driver   : nvidia-driver-525-server - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin
最好选择 distro 专有，non-free 闭源，最好是 -server 结尾的安装包
因此我们选择 nvidia-driver-515-server 进行安装： 
sudo apt install nvidia-driver-515-server
重启命令： 
sudo reboot
安装 NVIDIA 配置功能： 
sudo apt install nvidia-xconfig nvidia-settings nvidia-prime
挽救横光标黑屏命令
如果重启后黑屏，可通过以下方法解决。
ctrl + alt + f3 进入tty命令行界面后登录。
查询显示管理器：
cat /etc/X11/default-display-manager
如果输出/usr/sbin/gdm3，说明显示管理器是gdm3，执行以下命令解决：
sudo systemctl restart gdm3
同理，如果是ligtdm或者sddm等，将命令中的gdm3改为对应即可。
通常情况下新显卡30系列可能有适配问题会黑屏，老显卡10/20系列问题不大。


Pytorch 图像分类实战 —— ImageNet 数据集
2019-07-26T09:02:52.000Z
Pytorch 深度学习框架和 ImageNet 数据集深受科研工作者的喜爱。本文使用 Pytorch 1.0.1 版本对 ImageNet 数据集进行图像分类实战，包括训练、测试、验证等。
ImageNet 数据集下载及预处理
数据集选择常用的 ISLVRC2012 (ImageNet Large Scale Visual Recognition Challenge)
下载地址：
测试集 http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar(12.7GB)
验证集http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_val.tar(6.3GB)
训练集http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train.tar(138GB)
预处理：
为了使用 Pytorch 自带的 DataLoader 函数进行数据集加载，我们需要将每一个相同类的图片放到相同的文件夹。
训练集只需要解压缩即可：
mkdir train && mv ILSVRC2012_img_train.tar train/ && cd train
tar -xvf ILSVRC2012_img_train.tar && rm -f ILSVRC2012_img_train.tar
find . -name "*.tar" | while read NAME ; do mkdir -p "${NAME%.tar}"; tar -xvf "${NAME}" -C "${NAME%.tar}"; rm -f "${NAME}"; done
cd ..
但是验证集图片都在一个文件夹，需要重新分类：
mkdir val && mv ILSVRC2012_img_val.tar val/ && cd val && tar -xvf ILSVRC2012_img_val.tar
wget -qO- https://raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh | bash
代码详解
参数设置
参数设置的方式有很多种，有的人喜欢直接在主文件中进行设置；有的人喜欢用 argparse 这个模块；也有人喜欢用 json 格式的文件，我个人喜欢单独创建个 Python 类，以类属性的形式定义参数，详情见下：
class DefaultConfigs(object):
    # 1.string parameters
    train_dir = "/home/ubuntu/share/dataset/imagenet/train"
    val_dir = '/home/ubuntu/share/dataset/imagenet/val'
    model_name = "resnet18"
    weights = "./checkpoints/"
    best_models = weights + "best_model/"

    # 2.numeric parameters
    epochs = 40
    start_epoch = 0
    batch_size = 16
    momentum = 0.9
    lr = 1e-3
    weight_decay = 1e-4
    interval = 10
    workers = 12

    # 3.boolean parameters
    evaluate = False
    pretrained = False
    resume = False
评价指标
当我们需要评价一个模型的准确率时，需要输出 top1、top5 等准确率，使用下面函数进行封装。其中 AverageMeter 类可快速计算多个值的平均值等。
class AverageMeter(object):
    """Computes and stores the average and current value"""

    def __init__(self, name, fmt=':f'):
        self.name = name
        self.fmt = fmt
        self.reset()

    def reset(self):
        self.val = 0
        self.avg = 0
        self.sum = 0
        self.count = 0

    def update(self, val, n=1):
        self.val = val
        self.sum += val * n
        self.count += n
        self.avg = self.sum / self.count

    def __str__(self):
        fmtstr = '{name} {val' + self.fmt + '} ({avg' + self.fmt + '})'
        return fmtstr.format(**self.__dict__)


def accuracy(output, target, topk=(1,)):
    """Computes the accuracy over the k top predictions for the specified values of k"""
    with torch.no_grad():
        maxk = max(topk)
        batch_size = target.size(0)

        _, pred = output.topk(maxk, 1, True, True)
        pred = pred.t()
        correct = pred.eq(target.view(1, -1).expand_as(pred))

        res = []
        for k in topk:
            correct_k = correct[:k].view(-1).float().sum(0, keepdim=True)
            res.append(correct_k.mul_(100.0 / batch_size))
        return res
验证模型准确率
当验证模型和训练模型时都需要使用验证集验证模型准确率，来指导下一步操作。注意需要将 model 切换为 evaluate 模式。其中 torch.no_grad() 表示计算时不会改变模型梯度。
def validate(val_loader, model, criterion):
    batch_time = AverageMeter('Time', ':6.3f')
    losses = AverageMeter('Loss', ':.4e')
    top1 = AverageMeter('Acc@1', ':6.2f')
    top5 = AverageMeter('Acc@5', ':6.2f')

    # switch to evaluate mode
    model.eval()

    with torch.no_grad():
        end = time.time()
        for batch_id, (images, target) in enumerate(val_loader):
            images, target = images.to(device), target.to(device)
            # compute output
            output = model(images)
            loss = criterion(output, target)

            # measure accuracy and record loss
            acc1, acc5 = accuracy(output, target, topk=(1, 5))
            losses.update(loss.item(), images.size(0))
            top1.update(acc1[0], images.size(0))
            top5.update(acc5[0], images.size(0))

            # measure elapsed time
            batch_time.update(time.time() - end)
            end = time.time()

            if (batch_id + 1) % config.interval == 0:
                print('Acc@1: {top1.avg:.3f}\tAcc@5: {top5.avg:.3f}\tTime: {batch_time.val:.2f}\tID: {batch_id:d}'
                      .format(top1=top1, top5=top5, batch_time=batch_time, batch_id=(batch_id + 1) * config.batch_size))

        print(' * Acc@1 {top1.avg:.3f} Acc@5 {top5.avg:.3f}'
              .format(top1=top1, top5=top5))
    return top1.avg
训练模型
注意需要将 model 切换为 train 模式。
def train(train_loader, model, criterion, optimizer):
    batch_time = AverageMeter('Time', ':6.3f')
    data_time = AverageMeter('Data', ':6.3f')
    losses = AverageMeter('Loss', ':.4e')
    top1 = AverageMeter('Acc@1', ':6.2f')
    top5 = AverageMeter('Acc@5', ':6.2f')

    # switch to train mode
    model.train()

    end = time.time()
    for batch_id, (images, target) in enumerate(train_loader):
        # measure data loading time
        data_time.update(time.time() - end)
        images, target = images.to(device), target.to(device)

        # compute output
        output = model(images)
        loss = criterion(output, target)

        # measure accuracy and record loss
        acc1, acc5 = accuracy(output, target, topk=(1, 5))
        losses.update(loss.item(), images.size(0))
        top1.update(acc1[0], images.size(0))
        top5.update(acc5[0], images.size(0))

        # compute gradient and do SGD step
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        # measure elapsed time
        batch_time.update(time.time() - end)
        end = time.time()

        if (batch_id + 1) % config.interval == 0:
            print('Acc@1: {top1.avg:.3f}\tAcc@5: {top5.avg:.3f}\t'
                  'Loss: {losses.val}\tTime: {batch_time.val:.2f}\tID: {batch_id:d}'
                  .format(top1=top1, top5=top5, batch_time=batch_time,
                          losses=losses, batch_id=(batch_id + 1) * config.batch_size))

    print(' * Acc@1 {top1.avg:.3f} Acc@5 {top5.avg:.3f}'
          .format(top1=top1, top5=top5))
主体函数
注意在数据集加载时，train_loader 的 shuffle 为 True。
def main():
    global best_acc

    if config.pretrained:
        print("=> using pre-trained model '{}'".format(config.model_name))
        model = models.__dict__[config.model_name](pretrained=True)
    else:
        print("=> creating model '{}'".format(config.model_name))
        model = models.__dict__[config.model_name]()
    model.to(device)

    normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                     std=[0.229, 0.224, 0.225])

    criterion = nn.CrossEntropyLoss().to(device)
    optimizer = torch.optim.SGD(model.parameters(), config.lr,
                                momentum=config.momentum,
                                weight_decay=config.weight_decay)

    if config.resume:
        checkpoint = torch.load(config.best_models + "/model_best.pth.tar")
        config.start_epoch = checkpoint['epoch']
        best_acc = checkpoint['best_acc']
        model.load_state_dict(checkpoint['state_dict'])
        optimizer.load_state_dict(checkpoint['optimizer'])

    train_loader = torch.utils.data.DataLoader(
        datasets.ImageFolder(config.train_dir, transforms.Compose([
            transforms.RandomResizedCrop(224),
            transforms.RandomHorizontalFlip(),
            transforms.ToTensor(),
            normalize,
        ])),
        batch_size=config.batch_size, shuffle=True,
        num_workers=config.workers, pin_memory=True)

    val_loader = torch.utils.data.DataLoader(
        datasets.ImageFolder(config.val_dir, transforms.Compose([
            transforms.Resize(256),
            transforms.CenterCrop(224),
            transforms.ToTensor(),
            normalize,
        ])),
        batch_size=config.batch_size, shuffle=False,
        num_workers=config.workers, pin_memory=True)

    if config.evaluate:
        validate(val_loader, model, criterion)
        return

    for epoch in range(config.start_epoch, config.epochs):
        adjust_learning_rate(optimizer, epoch)

        print('\nEpoch: [%d | %d]' % (epoch + 1, config.epochs))

        train(train_loader, model, criterion, optimizer)
        test_acc = validate(val_loader, model, criterion)

        # save model
        is_best = test_acc > best_acc
        best_acc = max(test_acc, best_acc)
        save_checkpoint({
            'epoch': epoch + 1,
            "model_name": config.model_name,
            'state_dict': model.state_dict(),
            'acc': test_acc,
            'best_acc': best_acc,
            'optimizer': optimizer.state_dict(),
        }, is_best)
总结
本文使用的 Pytorch 版本为 1.0.1，且暂时只适用于 ImageNet 数据集，其他数据集需要一定地修改，完整代码地址如下：https://gist.github.com/xunge/d7be591bc1b41350273a61722c0d398a
参考资料
从实例掌握 pytorch 进行图像分类
pytorch/examples


激活函数总结 (Sigmoid, ReLU, Swish, Maxout)
2019-07-13T09:20:19.000Z
神经网络中使用激活函数来加入非线性因素，提高模型的表达能力。
激活函数需要具备以下几点性质:
连续并可导 (允许少数点上不可导) 的非线性函数。可导的激活函数可以直接利用数值优化的方法来学习网络参数。
激活函数及其导函数要尽可能的简单，有利于提高网络计算效率。
激活函数的导函数的值域要在一个合适的区间内，不能太大也不能太小，否则会影响训练的效率和稳定性。
1. Sigmoid 型激活函数
Sigmoid 型函数是指一类 S 型曲线函数，为两端饱和函数。常用的 Sigmoid 型函数有 Logistic 函数和 Tanh 函数。
1.1 Logistic 函数
公式定义如下：
\[\sigma(x)=\frac{1}{1+\exp (-x)}\]
特点：
当输入值在 0 附近时，函数近似为线性函数；当输入值靠近两端时，对输入进行抑制。
输入越小，越接近于 0；输入越大，越接近于 1。
其输出直接可以看作是概率分布，使得神经网络可以更好地和统计学习模型进行结合。
其可以看作是一个软性门 (Soft Gate)，用来控制其它神经元输出信息的数量。
1.2 Tanh 函数
公式定义如下：
\[\tanh (x)=\frac{\exp (x)-\exp (-x)}{\exp (x)+\exp (-x)}\]
Tanh 函数也可以看作是放大并平移的 Logistic 函数，其值域是 (−1, 1)。
\[\tanh (x)=2 \sigma(2 x)-1\]
Sigmoid 两个函数对比如下图所示。如图可知，Tanh 函数的输出是 零中心化的 (Zero-Centered)，而 Logistic 函数的输出恒大于 0。非零中心化的输出会使得其后一层的神经元的输入发生 偏置偏移 (Bias Shift)，并进一步使得梯度下降的收敛速度变慢。
2. ReLU 函数
线性整流函数 (Rectified Linear Unit, ReLU)，又称修正线性单元，通常指代以斜坡函数及其变种为代表的非线性函数。是目前深层神经网络中经常使用的激活函数。公式定义为：
\[\begin{aligned} \operatorname{ReLU}(x) &=\left\{\begin{array}{ll}{x} & {x \geq 0} \\ {0} & {x<0}\end{array}\right.\\ &=\max (0, x) \end{aligned}\]
优点：
采用ReLU的神经元只需要进行加、乘和比较的操作，计算上更加高效。
Sigmoid型激活函数会导致一个非稀疏的神经网络，而 ReLU 却具有很好的稀疏性，大约 50% 的神经元会处于激活状态。
相比于 Sigmoid 型函数的两端饱和，ReLU 函数为左饱和函数，且在 \(x > 0\) 时导数为 1，在一定程度上缓解了神经网络的梯度消失问题，加速梯度下降的收敛速度。
缺点：
ReLU 函数的输出是非零中心化的，给后一层的神经网络引入偏置偏移，会影响梯度下降的效率。
ReLU 神经元在训练时比较容易“死亡”。在训练时，如果参数在一次不恰当的更新后，第一个隐藏层中的某个 ReLU 神经元在所有的训练数据上都不能被激活，那么这个神经元自身参数的梯度永远都会是 0，在以后的训练过程中永远不能被激活。
为了避免上述情况，有几种 ReLU 的变种也会被广泛使用。
2.1 Leaky ReLU
带泄露的ReLU (Leaky ReLU) 在输入 \(x < 0\) 时，保持一个很小的梯度 \(\gamma\)。这样当神经元非激活时也能有一个非零的梯度可以更新参数，避免永远不能被激活。带泄露的ReLU的定义如下:
\[\begin{aligned} \text { LeakyReLU(x)} &=\left\{\begin{array}{ll}{x} & { x>0} \\ {\gamma x} & { x \leq 0}\end{array}\right.\\ &=\max (0, x)+\gamma \min (0, x) \end{aligned}\]
其中 \(\gamma\) 是一个很小的常数，比如 0.01。当 \(\gamma < 1\) 时，带泄露的 ReLU 也可以写为
\[\text { Leaky ReLU }(x)=\max (x, \gamma x)\]
相当于是一个比较简单的 maxout 单元。
2.2 PReLU
带参数的 ReLU (Parametric ReLU, PReLU) 引入一个可学习的参数，不同神经元可以有不同的参数。对于第 \(i\) 个神经元，其 PReLU 的定义为：
\[\begin{aligned} \operatorname{PReLU}_{i}(x) &=\left\{\begin{array}{ll}{x} & { x>0} \\ {\gamma_{i} x} & { x \leq 0}\end{array}\right.\\ &=\max (0, x)+\gamma_{i} \min (0, x) \end{aligned}\]
其中 \(\gamma_{i}\) 为 \(x \leq 0\) 时函数的斜率。因此，PReLU 是非饱和函数。如果 \(\gamma_{i}=0\)，那么 PReLU 就退化为 ReLU。如果 \(\gamma_{i}\) 为一个很小的常数，则 PReLU 可以看作带泄露的 ReLU。PReLU 可以允许不同神经元具有不同的参数，也可以一组神经元共享一个参数。
2.3 EReLU
指数线性单元 (Exponential Linear Unit, ELU)是一个近似的零中心化的非线性函数，其定义为：
\[\begin{aligned} \operatorname{ELU}(x) &=\left\{\begin{array}{ll}{x} & { x>0} \\ {\gamma(\exp (x)-1)} & { x \leq 0}\end{array}\right.\\ &=\max (0, x)+\min (0, \gamma(\exp (x)-1)) \end{aligned}\]
其中 \(\gamma \geq 0\) 是一个超参数，决定 \(x \leq 0\) 时的饱和曲线，并调整输出均值在 0 附近。
2.4 Softplus
Softplus 函数可以看作是 rectifier 函数的平滑版本，其定义为：
\[\operatorname{Softplus}(x)=\log (1+\exp (x))\]
Softplus 函数其导数刚好是 Logistic 函数。Softplus 函数虽然也有具有单侧抑制、宽兴奋边界的特性，却没有稀疏激活性。
下图给出了 ReLU、Leaky ReLU、ELU 以及 Softplus 函数的示例：
参考
激活函数(ReLU, Swish, Maxout)
神经网络与深度学习


搭建本地 Anaconda 镜像
2019-07-06T11:54:04.000Z
Anaconda是一个免费开源的Python等语言的发行版本，致力于简化包管理和部署，可以大大提高环境搭建效率。
然而Anaconda国外源在国内下载速度较慢，虽然国内有清华源可以大大提高下载速度（2019年4月清华源曾因版权原因关闭，但在5月已重新开放），但是肯定没有搭建一个本地源速度快。本文将详细介绍如何将Anaconda镜像安装在本地，以供本机以及局域网内的其他电脑访问。
下载所有镜像文件到本地
搭建本地镜像肯定需要将所有镜像文件下载到本地。
这里感谢清华开源下载镜像文件的Python代码，这里进行了一定的修改，代码如下。
可以看到代码中的路径改为了国内的清华源， repos 只选择了 main 和 free，arches 选择了 linux-64 和 win-64，当然也可以选择同步注释代码中的更多系统和版本。博主下载了这些文件共189.1 GB（2019年6月），也就是说只需要占用不到 200 GB 的磁盘空间，无需下载即可使用Anaconda安装Python包，还是很实用的。
具体代码如下：
#!/usr/bin/env python3
import os
import json
import hashlib
import tempfile
import shutil
import logging
import subprocess as sp
from pathlib import Path
from email.utils import parsedate_to_datetime

import requests
from pyquery import PyQuery as pq

DEFAULT_CONDA_REPO_BASE = "https://repo.continuum.io"
DEFAULT_CONDA_CLOUD_BASE = "https://conda.anaconda.org"

CONDA_REPO_BASE_URL = os.getenv("CONDA_REPO_URL", "https://repo.continuum.io")
CONDA_CLOUD_BASE_URL = os.getenv("CONDA_COULD_URL", "https://conda.anaconda.org")

WORKING_DIR = os.getenv("TUNASYNC_WORKING_DIR")

CONDA_REPOS = ("main", "free")
# CONDA_REPOS = ("main", "free", "r", "mro", "pro")

CONDA_ARCHES = (
    "linux-64", "win-64"
)
# CONDA_ARCHES = (
#     "noarch", "linux-64", "linux-32", "linux-armv6l", "linux-armv7l",
#     "linux-ppc64le", "osx-64", "osx-32", "win-64", "win-32"
# )

CONDA_CLOUD_REPOS = (
    "conda-forge/linux-64", "conda-forge/osx-64", "conda-forge/win-64", "conda-forge/noarch",
    "msys2/win-64", "msys2/noarch",
    "bioconda/noarch", "bioconda/linux-64", "bioconda/osx-64",
    "menpo/linux-64", "menpo/osx-64", "menpo/win-64", "menpo/win-32", "menpo/noarch",
    "pytorch/linux-64", "pytorch/osx-64", "pytorch/win-64", "pytorch/win-32", "pytorch/noarch", "peterjc123/win-64", "peterjc123/noarch",
)

logging.basicConfig(
    level=logging.INFO,
    format="[%(asctime)s] [%(levelname)s] %(message)s",
)


def md5_check(file: Path, md5: str=None):
    m = hashlib.md5()
    with file.open('rb') as f:
        while True:
            buf = f.read(1*1024*1024)
            if not buf:
                break
            m.update(buf)
    return m.hexdigest() == md5


def curl_download(remote_url: str, dst_file: Path, md5: str=None):
    sp.check_call([
        "curl", "-o", str(dst_file),
        "-sL", "--remote-time", "--show-error",
        "--fail", remote_url,
    ])
    if md5 and (not md5_check(dst_file, md5)):
        return "MD5 mismatch"


def sync_repo(repo_url: str, local_dir: Path, tmpdir: Path):
    logging.info("Start syncing {}".format(repo_url))
    local_dir.mkdir(parents=True, exist_ok=True)

    repodata_url = repo_url + '/repodata.json'
    bz2_repodata_url = repo_url + '/repodata.json.bz2'

    tmp_repodata = tmpdir / "repodata.json"
    tmp_bz2_repodata = tmpdir / "repodata.json.bz2"

    curl_download(repodata_url, tmp_repodata)
    curl_download(bz2_repodata_url, tmp_bz2_repodata)

    with tmp_repodata.open() as f:
        repodata = json.load(f)

    packages = repodata['packages']
    for filename, meta in packages.items():
        file_size, md5 = meta['size'], meta['md5']

        pkg_url = '/'.join([repo_url, filename])
        dst_file = local_dir / filename

        if dst_file.is_file():
            stat = dst_file.stat()
            local_filesize = stat.st_size

            if file_size == local_filesize:
                logging.info("Skipping {}".format(filename))
                continue

            dst_file.unlink()

        for retry in range(3):
            logging.info("Downloading {}".format(filename))
            err = curl_download(pkg_url, dst_file, md5=md5)
            if err is None:
                break
            logging.error("Failed to download {}: {}".format(filename, err))

    shutil.move(str(tmp_repodata), str(local_dir / "repodata.json"))
    shutil.move(str(tmp_bz2_repodata), str(local_dir / "repodata.json.bz2"))


def sync_installer(repo_url, local_dir: Path):
    logging.info("Start syncing {}".format(repo_url))
    local_dir.mkdir(parents=True, exist_ok=True)

    def remote_list():
        r = requests.get(repo_url)
        d = pq(r.content)
        for tr in d('table').find('tr'):
            tds = pq(tr).find('td')
            if len(tds) != 4:
                continue
            fname = tds[0].find('a').text
            md5 = tds[3].text
            yield (fname, md5)

    for filename, md5 in remote_list():
        pkg_url = "/".join([repo_url, filename])
        dst_file = local_dir / filename

        if dst_file.is_file():
            r = requests.head(pkg_url)
            remote_filesize = int(r.headers['content-length'])
            remote_date = parsedate_to_datetime(r.headers['last-modified'])
            stat = dst_file.stat()
            local_filesize = stat.st_size
            local_mtime = stat.st_mtime

            if remote_filesize == local_filesize and remote_date.timestamp() == local_mtime:
                logging.info("Skipping {}".format(filename))
                continue

            dst_file.unlink()

        for retry in range(3):
            logging.info("Downloading {}".format(filename))
            err = curl_download(pkg_url, dst_file, md5=md5)
            if err is None:
                break
            logging.error("Failed to download {}: {}".format(filename, err))


def main():
    import argparse
    parser = argparse.ArgumentParser()
    parser.add_argument("--working-dir", default=WORKING_DIR)
    args = parser.parse_args()

    if args.working_dir is None:
        raise Exception("Working Directory is None")

    working_dir = Path(args.working_dir)

    # for dist in ("archive", "miniconda"):
    #     remote_url = "{}/{}".format(CONDA_REPO_BASE_URL, dist)
    #     local_dir = working_dir / dist
    #     try:
    #         sync_installer(remote_url, local_dir)
    #     except Exception:
    #         logging.exception("Failed to sync installers of {}".format(dist))

    for repo in CONDA_REPOS:
        for arch in CONDA_ARCHES:
            remote_url = "{}/pkgs/{}/{}".format(CONDA_REPO_BASE_URL, repo, arch)
            local_dir = working_dir / "pkgs" / repo / arch

            tmpdir = tempfile.mkdtemp()
            try:
                sync_repo(remote_url, local_dir, Path(tmpdir))
            except Exception:
                logging.exception("Failed to sync repo: {}/{}".format(repo, arch))
            finally:
                shutil.rmtree(tmpdir)

    # for repo in CONDA_CLOUD_REPOS:
    #     remote_url = "{}/{}".format(CONDA_CLOUD_BASE_URL, repo)
    #     local_dir = working_dir / "cloud" / repo

    #     tmpdir = tempfile.mkdtemp()
    #     try:
    #         sync_repo(remote_url, local_dir, Path(tmpdir))
    #     except Exception:
    #         logging.exception("Failed to sync repo: {}".format(repo))
    #     finally:
    #         shutil.rmtree(tmpdir)


if __name__ == "__main__":
    main()
建立索引
下载的文件会在 pkgs 根目录下，我们需要运行以下命令
conda index pkgs/*
运行需要较长时间，运行完成后会在 free 和 main 文件夹内生成 noarch 文件夹。
搭建 http 文件服务器
为了使局域网内的用户都可访问本地Anaconda镜像，我们首先搭建一个本地http服务器，参考这篇 博客
在 ubuntu 系统下运行下面命令
sudo apt install apache2
apache2 的配置文件是 /etc/apache2/apache2.conf。
服务器默认的访问路径在 /var/www/html 目录下。
创建软链接，例如我们的镜像 pkgs 文件夹在 /home/ubuntu/mirror/anaconda/pkgs ，在 /var/www/html 目录下通过命令 ln -s /home/ubuntu/mirror/anaconda/pkgs/ anaconda/pkgs 创建一个软连接。就可以通过 http://192.168.1.10/anaconda/pkgs 访问到文件目录。
使用本地镜像
通过以下命令设置Anaconda的镜像路径：
conda config --add channels http://192.168.1.10/anaconda/pkgs/free/
conda config --add channels http://192.168.1.10/anaconda/pkgs/main/
conda config --set show_channel_urls yes
然后编辑配置文件 .condarc，一般在 ~/.condarc，去掉最后的 - defaults
至此，本地镜像的配置完成，我们可以离线安装Anaconda管理包了，速度不是一般的快。
定时运行 anaconda.py 以更新镜像 (2019.08.11 更新)
为了使得镜像及时更新，我们可以使用 Linux 的 crontab 服务定时更新 anaconda.py 脚本。具体方法如下：
运行 crontab –e 编写一条定时任务：
0 1    * * 6    /usr/bin/python /home/ubuntu/anaconda.py --working-dir /home/ubuntu/anaconda-mirror > /home/ubuntu/auto.log
意思是每周六的凌晨 1:00 执行 anaconda.py 脚本。
其他关于 crontab 的详细说明见文档说明 19. crontab 定时任务
运行 crontab –l 进行验证。
运行 service cron restart 重启服务。


使用 VBA（宏）批量替换 Word 中的字词
2019-06-19T06:53:27.000Z
当使用翻译软件翻译论文时，经常会将某些专业名词翻译错误，例如将 adversarial example 翻译为 对抗性的例子 而不是 对抗样本。虽然 Word 可以全局替换，但是一次只能替换一个词组，如果想同时替换多个词组将非常费事。这时使用 VBA 将是一个不错的选择。
添加宏
视图 -> 宏 -> 查看宏 -> 新建宏 命名为 replace。
在打开的 VB 编辑器粘贴下面代码，更改具体的替换词语，即可
Sub replace()
'
' replace 宏
'
    Const wdReplaceAll = 2
    Dim oRng As Range
    Set oRng = ActiveDocument.Content
    With oRng.Find
        .Execute FindText:="对抗性的例子", ReplaceWith:="对抗样本", replace:=wdReplaceAll
        .Execute FindText:="对抗性示例", ReplaceWith:="对抗样本", replace:=wdReplaceAll
        .Execute FindText:="对抗性实例", ReplaceWith:="对抗样本", replace:=wdReplaceAll
        .Execute FindText:="对抗性例子", ReplaceWith:="对抗样本", replace:=wdReplaceAll
        .Execute FindText:="对抗实例", ReplaceWith:="对抗样本", replace:=wdReplaceAll
        .Execute FindText:="对手", ReplaceWith:="攻击者", replace:=wdReplaceAll
        .Execute FindText:="挤压", ReplaceWith:="压缩", replace:=wdReplaceAll
        .Execute FindText:="功能", ReplaceWith:="特征", replace:=wdReplaceAll
        .Execute FindText:="显着", ReplaceWith:="显著", replace:=wdReplaceAll
        .Execute FindText:="稳健", ReplaceWith:="鲁棒", replace:=wdReplaceAll
        .Execute FindText:="健壮", ReplaceWith:="鲁棒", replace:=wdReplaceAll
        .Execute FindText:="样品", ReplaceWith:="样本", replace:=wdReplaceAll
        .Execute FindText:="渐变", ReplaceWith:="梯度", replace:=wdReplaceAll
        .Execute FindText:="培训", ReplaceWith:="训练", replace:=wdReplaceAll
        .Execute FindText:="规范", ReplaceWith:="范数", replace:=wdReplaceAll
        .Execute FindText:="探测", ReplaceWith:="检测", replace:=wdReplaceAll
        .Execute FindText:="辍学", ReplaceWith:="dropout", replace:=wdReplaceAll
        .Execute FindText:="图层", ReplaceWith:="层", replace:=wdReplaceAll
        .Execute FindText:="合法示例", ReplaceWith:="合法样本", replace:=wdReplaceAll
        .Execute FindText:="对抗性样本", ReplaceWith:="对抗样本", replace:=wdReplaceAll
        .Execute FindText:="对抗性训练", ReplaceWith:="对抗训练", replace:=wdReplaceAll
        .Execute FindText:="对抗性鲁棒性", ReplaceWith:="对抗鲁棒性", replace:=wdReplaceAll
        .Execute FindText:="对抗性强大", ReplaceWith:="对抗鲁棒性", replace:=wdReplaceAll
        .Execute FindText:="敌对", ReplaceWith:="对抗", replace:=wdReplaceAll
    End With
End Sub
保存后关闭编辑器即可。
之后只需要运行名为 replace 的宏即可。
也可以将该宏添加到快速访问工具栏中，这样可以更方便的调用宏。


使用 LXD 搭建多人使用的 GPU 服务器
2019-05-31T03:17:22.000Z
由于深度学习的火热以及深度学习对 GPU 的强烈需求，实验室购置了一台性能强悍的 GPU 服务器，供大家一起使用。然而如果所有人都对这台服务器拥有控制权是十分危险的，例如误删他人文件，弄乱他人环境等。最直观的方法就是为每一个同学开启一个虚拟机，但是硬件虚拟化造成大量的资源浪费，同时GPU并不支持常规的虚拟化。
本文采用在宿主机上创建多个 LXD 容器的软件虚拟化方法，使得资源能够更好的利用。
基于上述背景提出以下需求：
不同用户之间不能相互影响且可以同时使用；
用户可以使用 ssh 方便地访问自己的“机器”；
用户拥有所有权限；
用户不被允许直接操作宿主机；
用户可以使用宿主机的所有资源，包括 CPU、GPU、内存、硬盘等。
本人在 Ubuntu 18.04 的宿主机上使用 LXD 容器中的 Ubuntu 18.04 系统完成了上述所有需求。
安装 lxd、zfs 及 bridge-utils
sudo snap install lxd
sudo apt install zfsutils-linux bridge-utils
我们需要安装LXD实现虚拟容器，ZFS作为LXD的存储管理工具，bridge-utils用于搭建网桥。由于apt安装的LXD不是最新版本，这里使用snap安装工具安装LXD。
LXD 初始化
sudo lxd init
在初始化过程中，不要创建新的网桥，ZFS设置大小要尽量大，其他设置默认即可。详情如下：
Would you like to use LXD clustering? (yes/no) [default=no]:
Do you want to configure a new storage pool? (yes/no) [default=yes]:
Name of the new storage pool [default=default]: lxd
Name of the storage backend to use (btrfs, ceph, dir, lvm, zfs) [default=zfs]:
Create a new ZFS pool? (yes/no) [default=yes]:
Would you like to use an existing block device? (yes/no) [default=no]:
Size in GB of the new loop device (1GB minimum) [default=100GB]: 800
Would you like to connect to a MAAS server? (yes/no) [default=no]:
Would you like to create a new local network bridge? (yes/no) [default=yes]: no
Would you like to configure LXD to use an existing bridge or host interface? (yes/no) [default=no]: yes
Name of the existing bridge or host interface: br0
Would you like LXD to be available over the network? (yes/no) [default=no]:
Would you like stale cached images to be updated automatically? (yes/no) [default=yes]
Would you like a YAML "lxd init" preseed to be printed? (yes/no) [default=no]:
新建容器
如果网速允许可以尝试：
sudo lxc launch ubuntu:xenial yourContainerName
如果网速不行可以添加清华大学的镜像：
sudo lxc remote add tuna-images https://mirrors.tuna.tsinghua.edu.cn/lxc-images/ --protocol=simplestreams –public
使用如下命令查看清华镜像的所有系统：
sudo lxc image list tuna-images:
选择容器系统并记录第二列的 FINGERPRINT，如 ubuntu/18.04 的FINGERPRINT为 0023c4e9dc6e
然后使用如下命令创建新容器：
sudo lxc launch tuna-images:0023c4e9dc6e yourContainerName
配置网络环境
在实验室的其他电脑访问服务器中的 LXD 容器有两种方法。
给每个用户分配一个端口，利用 iptables 把这个端口转发到对应 LXD 容器的 22 端口；
使用桥接模式，每个容器的 IP 与实验室的 IP 域相同，物理外部、局域网内部的机器可以直接 ssh 容器的 IP，不需要端口号就可以登陆。
很明显，第 2 种方法比第 1 种方法好，不仅登录方便，而且每个容器的所有端口都是开放的，可以拿其他端口做一些事情，如搭建网站、开启服务等。
第 2 种方法的详细步骤参见本人博客 LXD 使用 Netplan 实现在同一网络访问
修改容器的用户名密码
由于容器默认的用户名为 ubuntu，我们需要在安装其他程序之前更改用户名即密码，以避免路径冲突。
修改root密码：
passwd root
修改用户ubuntu密码：
passwd ubuntu
修改用户名：
usermod -l  -d /home/ -m 
groupmod -n  
容器中安装 ssh 服务
sudo apt-get install openssh-server
至此，已经可以使用实验室的任意电脑通过 ssh 直接访问容器而不需要操作宿主机。
安装显卡驱动
在宿主机中首先需要安装显卡驱动，使用如下命令安装推荐的显卡驱动：
sudo ubuntu-drivers autoinstall
但是这个方法安装的驱动往往不是最新的，可以去 NVIDIA 官网 下载最新驱动并安装。具体方法参考 Ubuntu 16.04安装NVIDIA驱动 和 超详细! Ubuntu 18.04 安装 NVIDIA 显卡驱动
使用 nvidia-smi 查看驱动版本，并在官网下载对应的驱动，以便于在容器中安装和宿主机相同版本的NVIDIA驱动。
为容器添加所有GPU：
sudo lxc config device add  gpu gpu
添加指定GPU：
sudo lxc config device add  gpu0 gpu id=0
在容器中安装显卡驱动：
sudo sh ./NVIDIA-Linux-x86_64-xxx.xx.run --no-kernel-module
因为在容器中显卡驱动不需要安装内核文件，所以后面加上 --no-kernel-module。
在容器中安装好显卡驱动重启后输入 nvidia-smi 检查驱动是否安装成功
宿主机安装 lxdui 管理容器
因为 LXD 相当于 LXC 增加了 RESTful API，所以可以通过 WEB 界面管理容器。lxdui 为不错的管理界面。具体安装方法详见 lxdui 的 github
目前 lxdui 版本为 2.1.2，我使用有一些 bug，例如 snapshot、clone 等操作只能在容器表格中的 Actions 进行操作，进入容器后顶部的 snapshot、clone 等按钮是无效的。所以 lxdui 主要还是方便查看和管理，具体的操作还是用命令吧。
容器快照管理
以上所有对容器的操作基本完成，现在需要建立快照，以备将来需要恢复快照，或者可以从快照新建一个容器，这样可以避免上面的重复劳动。
创建快照：
sudo lxc snapshot  
恢复快照：
sudo lxc restore  
从快照新建一个容器 (新旧容器 MAC 地址不同)：
sudo lxc copy / 
这也是比较好的创建容器的方法。如果直接 clone 容器的话，MAC 地址等关键信息也会同样被复制。
容器和宿主机间复制文件：
在宿主机输入以下命令
sudo lxc file push  / # 表示从容器中复制文件到宿主机
sudo lxc file pull /  # 表示将宿主机的文件复制到容器
复制文件夹需要在最后加 -r
共享文件夹：
创建共享文件夹：
sudo lxc config set  security.privileged true
sudo lxc config device add   disk path=/home/xxx/share source=/home/xxx/share
其中 path 为容器路径，source 为宿主机路径。device-name 随意取名字即可。
移除共享文件夹：
sudo lxc config device remove  
CUDA 与 cuDNN
CUDA 与 cuDNN 的安装建议使用 Anaconda 安装，因为使用 Anaconda 安装 TensorFlow 或 PyTorch 都会自带 CUDA 与 cuDNN，并且据说有一定的优化。具体命令为：
conda create -n tf_gpu1.9 tensorflow-gpu=1.9
conda create -n pytorch pytorch=0.4
只要 CUDA 版本与 NVIDIA 驱动版本相对应即可，可以在 Release Notes :: CUDA Toolkit Documentation 查找。
安装远程桌面 (2019.08.11 更新)
参考文档：How to Connect to a Ubuntu 18.04 Server via Remote Desktop Connection using xRDP
1. 安装 xRDP
xRDP 是一款非常不错的远程桌面软件，且全平台支持。安装 xRDP 最好在干净的系统上安装。
Windows 可以直接使用微软的远程桌面连接。
Mac 可以使用 Microsoft Remote Desktop mac 版，App Store 搜不到，这里放上 下载链接。
Linux 可使用 FreeRDP、Rdesktop 等开源软件。
sudo apt-get update
sudo apt-get install xrdp
2. 安装桌面环境
Ubuntu 有很多桌面环境，例如 XFCE, Lubuntu, Xubuntu 和 MATE 等。这里使用 XFCE 为例：
sudo apt-get install xfce4
现在就可以使用远程桌面软件，通过 IP 即可访问。
在 LXD / LXC 中使用 Docker 容器 (2019.09.01 更新)
参考文档：docker run hello-world still fails, permission denied - stackoverflow
在 LXD 环境中依然可以使用 Docker，但是需要更改一些配置，否则在 pull 镜像时会有 permission denied 错误，如下：
OCI runtime create failed: container_linux.go:345: starting container process caused "process_linux.go:430: container init caused \"rootfs_linux.go:58: mounting \\\"proc\\\" to rootfs \\\"/var/lib/docker/vfs/dir/c5cedb213621362913c6d950eec507ba91e04f2a933cd6d309f1c74a92c346ec\\\" at \\\"/proc\\\" caused \\\"permission denied\\\"\"": unknown
我们只需要在宿主机对容器进行以下配置即可：
sudo lxc config set  security.nesting true
sudo lxc config set  security.privileged true
RuntimeError: cuda runtime error (30) (2019.10.10 更新)
重启宿主机后，再使用容器里的环境时会找不到 CUDA，报下面的错误：
RuntimeError: cuda runtime error (30) : unknown error at /tmp/pip-req-build-58y_cjjl/aten/src/THC/THCGeneral.cpp:50
或者 torch.cuda.is_available() 是 false
网上其他人报这个错误可能是因为 CUDA 没有安装，但我使用的是 Anaconda 自动安装的 CUDA 和 cuDNN，容器和宿主机都可以运行 nvidia-smi 命令查看显卡驱动版本，并且在重启前是没有错误的，为什么重启后就报错了呢？为此我甚至重装系统，但这个问题依然存在。。。
目前临时的解决办法是：
重启宿主机后，需要使用宿主机的 Python 环境运行一次使用 CUDA 的程序；
例如，如果是pytorch环境，可以运行下面的代码：
python -c 'import torch; print(torch.cuda.is_available())'
重启所有容器。
这样容器里的 CUDA 就可以找到了。这可能是 LXC 的配置问题，如果有人遇到相同问题有更好的解决方案希望可以告知，万分感谢~
宿主机重启后找不到显卡驱动(2020.6.2 更新)
重启宿主机后，显卡驱动掉了，所有用到显卡的容器都无法启动，输入nvidia-smi报错：
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running
原因可能是宿主机运行了sudo apt upgrade命令并更新了系统内核，导致安装显卡驱动时的内核与现有内核版本不一致，解决办法参考此解决办法
sudo apt-get install dkms # DKMS，Dynamic Kernel Module Support，可以帮我们维护内核外的这些驱动程序，在内核版本变动之后可以自动重新生成新的模块。
sudo dkms install -m nvidia -v 430.50
DKMS全称是Dynamic Kernel Module Support，它可以帮我们维护内核外的这些驱动程序，在内核版本变动之后可以自动重新生成新的模块。
430.50是安装驱动的版本，可进入/usr/src查看nvidia-430.50的文件夹获取版本号
重启后输入nvidia-smi就应该正常输出了。如果还是不好使，可以重启后重新运行上述命令再重启。
如果仍不好使，说明该内核下无法编译显卡驱动，解决方法是内核降级为原来版本，具体方法参考如何降级/切换 Ubuntu 系统 Linux 内核启动版本
查看系统可用内核
grep menuentry /boot/grub/grub.cfg
可以看到子选项：
Ubuntu, with Linux 5.3.0-62-generic
修改内核启动版本
使用vim编辑grub文件：
sudo vim /etc/default/grub
GRUB_DEFAULT=0 // 0表示系统当前启动的内核序号
修改为想要启动的内核版本对应子选项：
GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 5.3.0-62-generic"
注意，>两侧没有空格，这个原博客有错误。
更新 Grub
sudo update-grub
查看系统当前运行内核信息
uname -r(或-a)
容器硬盘ZFS扩容
LXD 初始化的时候会对 ZFS 进行空间分配，但是随着时间的推移仍有扩容的需求。当容器变得很卡的时候，有可能就是 ZFS 分配的空间已满。
输入下面的命令可以对 ZFS 进行扩容，以扩容512GB为例：
sudo truncate -s +512G /var/snap/lxd/common/lxd/disks/lxd.img
sudo zpool set autoexpand=on lxd
sudo zpool online -e lxd /var/snap/lxd/common/lxd/disks/lxd.img
sudo zpool set autoexpand=off lxd
其中，lxd.img 为初始化时定义的容器名称，不知道容器名称的可以通过下述命令查看 sudo ls /var/snap/lxd/common/lxd/disks/
总结
至此，多人使用的 GPU 服务器就搭建完成了，当需要新建容器时，只需要完成以下几步：
从快照中新建容器；
lxc exec  bash 进入容器；
更改容器的 IP；
更改容器的用户名、密码；
新增共享目录；
这在以后可以编写脚本，使得新建操作更容易。


LXD 使用 Netplan 实现在同一网络访问
2019-05-20T01:01:42.000Z
为了使实验室服务器可以被多人同时使用而不互相影响，实验室每一个人都拥有一个自己的 LXD 容器，但是 LXD 默认使用自己的网桥，无法在实验室的内网直接访问。
本文使用 Ubuntu 18.04 默认的网络配置工具 Netplan 管理网络，实现 LXD 容器的 IP 与实验室的 IP 域相同。
宿主机网络配置
Ubuntu 17.10 以后默认使用 Netplan 管理网络。进入 /etc/netplan/ 目录有一个 yaml 配置文件，下面的命令需要根据自己的 yaml 文件名称自行修改
备份配置文件：
sudo cp /etc/netplan/01-netcfg.yaml /etc/netplan/01-netcfg.yaml.bak
编辑 yaml 配置文件：
sudo vim /etc/netplan/01-netcfg.yaml
如下：
# This file describes the network interfaces available on your system
# For more information, see netplan(5).
network:
  version: 2
  renderer: networkd
  ethernets:
    eno1:
      dhcp4: no
      dhcp6: no
  bridges:
    br0:
      dhcp4: no
      dhcp6: no
      interfaces:
        - eno1
      addresses: [ 192.168.1.2/24 ]
      gateway4: 192.168.1.1
      nameservers:
          addresses:
              - 114.114.114.114
              - 8.8.8.8
      parameters:
          stp: false
          forward-delay: 0
addresses: [ 192.168.1.2/24 ] 为任意网络无人占用的 IP 即可。
gateway4 为网关地址。
eno1 为网卡名称，可以使用 ip a 或 ifconfig 命令查看。
应用网络配置：
sudo netplan --debug apply
重启后确认网络可用：
sudo reboot
ip a
ping baidu.com
容器网络配置
进入容器：
sudo lxc exec  bash
编辑 yaml 配置文件：
nano /etc/netplan/50-cloud-init.yaml
如下：
network:
  version: 2
  ethernets:
    eth0:
      dhcp4: no
      dhcp6: no
      addresses:
        - 192.168.1.3/24
      gateway4: 192.168.1.1
      nameservers:
        addresses:
          - 114.114.114.114
          - 8.8.8.8
应用网络配置：
netplan --debug apply
同样重启后检查网络连接：
sudo reboot
ip a
ping baidu.com
参考资料
Lxd + Netplan + Static IP’s in same subnet HOW-TO


14 年 MacBook Pro 升级 Intel 760p NVME SSD
2018-11-18T01:01:42.000Z
作者一年后更新：
不再建议使用转接卡更换苹果电脑固态硬盘，因为在一年后就无法正常工作了。转接卡失效，760p 固态硬盘主控坏掉，只能识别 1 GB 的缓存。虽然数据及时导出，且硬盘有 5 年质保，但仍不推荐使用此方法扩容。可以尝试咸鱼购买拆机硬盘，现在也不贵。
本教程适用于 13/14/15 年 MacBook Pro 升级非官方硬盘
由于 MacBook Pro 的硬盘接口是自己设计的，所以更换硬盘有两种选择：
选择 苹果 自家接口的固态硬盘。优点：兼容性好；缺点：贵，速度慢
选择 M.2 接口且兼容的固态硬盘 + 转接卡。优点：便宜，速度快，兼容性也很好；缺点：自己动手有风险（很小），失去保修，不好出二手
本文将介绍使用第三方 M.2 接口的固态硬盘和转接卡升级 MacBook Pro 硬盘的方案
之前的准备
SSD 与转接卡的选择
SSD 主要是根据广大网友的前车之鉴，目前比较推荐的有三星 SM951，Intel 760P等。博主选择的是 Intel 760P，因为 SM951 目前很难买到新款，基本上都是拆机的二手货，没有质保，而 Intel 760P 有 5 年保修，价格也差不多。
转接卡在淘宝搜索 苹果SSD转接卡 2014 mac book，博主买的转接卡如下图所示。
制作 macOS 系统盘
因为在 macOS 10.13 High Sierra 版本后系统支持了 NVME 硬盘协议，所以我们安装的 macOS 版本必须是10.13之后的系统。本文选择的是 macOS 10.14 Mojave 版本，具体制作 macOS系统盘的教程可以参考 本人博客
TimeMachine 备份系统
硬盘有价，数据无价！
拆机时还需要 T5 的螺丝刀，这里建议购买 米家wiha螺丝刀
更换过程
拆机等详细步骤可以参考 IFIXIT 更换 SSD 教程
拆机过程要注意上面两颗螺丝和其他八颗螺丝的长度是不一样的，重新装机的时候要注意。
后机盖和机身有两个卡扣固定，装机要确定卡扣卡紧再上螺丝。
更换完 SSD 是这样的
注意一定要将硬盘接头用力往里塞紧，并保证固定螺丝是可以拧上固定的状态。
重装系统
插上刚才制作的 macOS 系统盘，按住 option 键开机，选择 install macOS 进入下面界面，选择磁盘工具，继续
将新安装的 SSD 抹掉，格式为 Mac OS 扩展（日志式），方案为 GUID 分区图，如下图所示
若没有检测到新硬盘，则可能是硬盘没有插紧，或者硬盘不是全新的硬盘留有分区，只需要在 Windows 系统下删除卷即可
之后关闭磁盘工具，进入第二项 安装 macOS 即可成功安装。
新旧硬盘测速图如下（都是刚装完系统就测试的）：
休眠无法唤醒的解决办法
如果将电脑扣盖休眠 8 小时后（或者电脑休眠至没电关机）再开机发现无法唤醒电脑（电脑屏幕亮，但无反应），那么你可能需要继续往下阅读
Mac 电脑默认模式下休眠时间超过 8 小时后会将内存中的资料存储在硬盘中并将内存断电，以达到更好的省电目的。可能因为转接卡或硬盘不兼容将资料从硬盘导入内存造成无法唤醒的现象。
方法1：重置 Mac 笔记本电脑上的 SMC 和 NVRAM：
以下来自苹果官网：
1.如何重置 Mac 笔记本电脑上的 SMC：
如果电池不可拆卸： 选取苹果菜单 >“关机”。 等 Mac 关机后，按下内建键盘左侧的 Shift-Control-Option，然后同时按下电源按钮。按住这些按键和电源按钮 10 秒钟。 如果您的 MacBook Pro 带有触控 ID，则触控 ID 按钮也是电源按钮。 松开所有按键。 再次按下电源按钮以开启 Mac。
2.如何重置 NVRAM
将 Mac 关机，然后开机并立即同时按住以下四个按键：Option、Command、P 和 R。您可以在大约 20 秒后松开这些按键，在此
期间您的 Mac 可能看似在重新启动。
在发出启动声的 Mac 电脑上，您可以在两次启动声之后松开这些按键。 在 iMac Pro 上，您可以在 Apple 标志第二次出现并消失后松开这些按键。 如果您的 Mac 使用了固件密码，这个组合键将不起任何作用或导致您的 Mac 从 macOS 恢复功能启动。要重置 NVRAM，请先关闭固件密码。
在您的 Mac 完成启动后，您可能需要打开“系统偏好设置”并调整已重置的任何设置，例如音量、显示屏分辨率、启动磁盘选择或时区。
方法2：更改电源管理模式
如果上述方法依旧存在休眠无法唤醒的情况，那就只能使用下述命令通过更改 hibernatemode，使电脑不进入内存断电的休眠模式。
# 永不休眠
sudo pmset -a hibernatemode 0 standby 0 autopoweroff 0
# 恢复默认
sudo pmset -a hibernatemode 3 standby 1 autopoweroff 1
详细命令参考博客 mac下pmset的使用方法
虽然更改后可能会略微增加耗电，但是开盖唤醒速度也会加快。需要注意的是更改模式后在电脑快要没电的时候需要关机，否则可能导致数据的丢失。


如何将 Matplotlib 图像展示在 web 页面上
2018-08-04T07:08:00.000Z
我们知道 Matplotlib 是一个非常强大的 Python 画图工具，其不仅可以画条形图、饼状图等统计图，也可以画以像素构成的图像。MATLAB 能画的图像，Matplotlib 通过 Python 语言也能画。
做项目的时候遇到一个需求，就是如何将网页后端生成的 Matplotlib 图像展示在前端页面上。尝试使用了如下几种方法，在此记录一下。
使用 mpld3 包
这是一个相对简单并且改动较小的方法，只需要在后端改一下 import 就可以，具体使用方法参照官方教程。
但是实现的时候遇到了一些问题
不适合大数据可视化的处理，当图像超过几千个元素时，前端展示的图像会有一定的模糊；
使用时必须联网；
一些 Matplotlib 的方法在 mpld3 中缺失。
保存在网页服务器的 static 目录下
该方法易于实现，首先将网页后端的图像保存到后端服务器的 static 目录下，前端再从 static 目录下读取图片进行展示。
但是依然存在一些问题
无法判断响应时间。因为后端生成图片的时间未知，所以只能采用在前端延时展示，这样也浪费时间资源；
前后端分离的项目中，前端访问后端 static 目录路径时不方便。
使用请求的方式将图像传到前端
该方法将图像以请求的方式传到前端，前端只需将  标签的 src 属性赋值为后端的请求路径即可。
该方法可以在后端生成完图像后再发送给前端，无需设置延时获取图像，但也遇到一些问题
项目中后端获取前端的请求后需要返回两个请求，一个是表格数据，一个是图像，这样代码就比较冗余；
由于 Matplotlib 生成的图像有白边，而只有加上 fig.savefig('a.png', bbox_inches='tight', pad_inches=0.0) 这句代码时才能去除白边，而发送请求只能发送 fig ，所以前端显示的图像有白边。
将图像以 Base64 格式发送给前端
该方法也是本人最终采取的方法。原理是在调用 savefig 方法时不存储为图像，而是存储为二进制格式，二进制格式再转化为 Base64 格式，并将其发送给前端，前端只需要将  标签的 src 属性赋值为后端发送的 Base64 字符串即可。
后端代码如下所示
from io import BytesIO
import base64
import matplotlib.pyplot as plt

fig = plt.figure(figsize=(1, 1))
...
sio = BytesIO()
fig.savefig(sio, format='png', bbox_inches='tight', pad_inches=0.0)
data = base64.encodebytes(sio.getvalue()).decode()
src = 'data:image/png;base64,' + str(data)
将最后一行的 src 传到前端即可展示。
该方法优点如下
该方法可以在后端生成完图像后再发送给前端，无需设置延时获取图像；
该方法只需要往前端发送一次请求，代码更加精简；
调用了 savefig 方法，可以去除白边。
所以几乎解决了之前方法的所有痛点


我是如何在黑苹果中编译安装 TensorFlow-GPU 1.8
2018-07-06T01:01:42.000Z
之前一直使用 Ubuntu Linux 系统作为 TensorFlow 机器学习的服务器，但是相对于 macOS 来说，无论是界面美化还是应用覆盖都是远远强于 Ubuntu 的，所以计划安装一个黑苹果作为 TensorFlow 的服务器
但是因为 TensorFlow 在 1.2 版本后不再支持 macOS 的 GPU 版本，只能通过编译源代码进行安装，过程较为繁杂，所以在此记录
首先确定 Mac 显卡是 NVIDIA 显卡，且compute capabilities >= 3.0，点击这里 查看你的显卡型号是否支持
环境概览
软件 版本号
macOS High Sierra 10.13.4
TensorFlow 1.8
python 3.6.4
NVIDIA Web-Drivers 387.10.10.10.30.106
CUDA-Drivers 387.178
CUDA Toolkit 9.1
cuDNN 7.0.5
bazel 0.10.0
Xcode 8.3.2
Command Line Tools for Xcode 8.3.2
环境搭建
安装 Homebrew
在终端输入下面命令安装 Homebrew
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
安装 coreutils，llvm，OpenMP
brew install coreutils llvm cliutils/apple/libomp
安装 Python 依赖
建议使用 Anaconda 包管理和 Virtualenv 虚拟环境等安装 Python
pip install six numpy wheel
安装 bazel
下载 0.10.0 版本中的 bazel-0.10.0-installer-darwin-x86_64.sh 文件
需要注意，这里必须是 0.10.0 版本，新或旧都能导致编译失败
在下载目录打开终端，输入下面命令进行安装
chmod +x bazel-0.10.0-installer-darwin-x86_64.sh
./bazel-0.10.0-installer-darwin-x86_64.sh
降级 Xcode 到 8.3.2
下载 Xcode 8.3.2 和 Command Line Tools for Xcode 8.3.2，Xcode 9 需要降级，因为编译 TensorFlow 只能使用 Xcode 8，官网下载需要登录苹果账号，官网下载链接，按名称排列即可快速找到。
Xcode8.3.2.xip (4.49GB) 下载后解压，重命名为 Xcode8.3.2 并复制到 应用程序 即可
CommandLineToolsforXcode8.3.2.dmg (166.1MB) 下载后安装即可
使用下面的命令在终端激活 Xcode 8.3.2
sudo xcode-select -s /Applications/Xcode8.3.2.app
换回 Xcode 9 可以用
sudo xcode-select -s /Applications/Xcode.app
NVIDIA
(1) 安装 NVIDIA Web-Drivers
下载 NVIDIA Web-Drivers 驱动，根据不同的 Mac 系统进行下载，点击这里 下载，支持 macOS 10.13.4 的版本为 387.10.10.10.30.106
WebDriver-387.10.10.10.30.106.pkg (63.9MB) 下载后安装即可
(2) 安装 CUDA-Drivers
下载 CUDA-Drivers 驱动，支持 CUDA 9.1 的版本号为 387.178，官网 下载、 百度云 下载
cudadriver_387.178_macos.dmg (39.9MB) 下载后安装即可
(3) 安装 CUDA Toolkit 9.1
下载 CUDA Toolkit 9.1，官网 下载和 百度云 下载
cuda_9.1.128_mac.dmg (1.53GB) 下载后安装即可
配置 CUDA 环境，编辑 ~/.bash_profile 文件，如果安装了zsh则编辑 ~/.zshrc 文件，打开终端：
open -e .bash_profile
然后在弹出的文件中添加：
export CUDA_HOME=/usr/local/cuda
export DYLD_LIBRARY_PATH=/usr/local/cuda/lib:/usr/local/cuda/extras/CUPTI/lib
export LD_LIBRARY_PATH=$DYLD_LIBRARY_PATH
export PATH=$PATH:$DYLD_LIBRARY_PATH
执行命令重启bash_profile
. ~/.bash_profile
检测CUDA能否正常运行：
cd /usr/local/cuda/samples
sudo make -C 1_Utilities/deviceQuery
./bin/x86_64/darwin/release/deviceQuery
第一次编译时可能需要同意苹果协议，按照要求填 agree 即可
最终结果为 Result = PASS 则安装正确。
(4) 安装 cuDNN 7.0.5
下载 cuDNN 7.0.5，该版本支持 CUDA 9.1 ，官网下载时需要登录 NVIDIA 账号，官网 下载、 百度云 下载
cudnn-9.1-osx-x64-v7-ga.tgz (340.3MB) 下载后解压，切换到解压缩的 cuda 目录，输入以下命令
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib/libcudnn_static.a /usr/local/cuda/lib
sudo cp cuda/lib/libcudnn.7.dylib /usr/local/cuda/lib
sudo ln -s /usr/local/cuda/lib/libcudnn.7.dylib /usr/local/cuda/lib/libcudnn.dylib
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib/libcudnn*
编译准备
拉取 TensorFlow 源码 release 1.8 分支
git clone https://github.com/tensorflow/tensorflow -b r1.8
cd tensorflow
修改代码，使其与 macOS 兼容
替换掉以下三个文件的 align(sizeof(T))
cd tensorflow
sed -i -e "s/ __align__(sizeof(T))//g" tensorflow/core/kernels/concat_lib_gpu_impl.cu.cc
sed -i -e "s/ __align__(sizeof(T))//g" tensorflow/core/kernels/depthwise_conv_op_gpu.cu.cc
sed -i -e "s/ __align__(sizeof(T))//g" tensorflow/core/kernels/split_lib_gpu.cu.cc
解决找不到 'protobuf.bzl' 的问题
我还遇到了以下错误
ERROR: /Users/xunge/Desktop/tensorflow/tensorflow/tools/pip_package/BUILD:166:1: error loading package 'tensorflow': Encountered error while reading extension file 'protobuf.bzl': no such package '@protobuf_archive//': java.io.IOException: thread interrupted and referenced by '//tensorflow/tools/pip_package:build_pip_package'
解决办法 如下：
sed -i '\@https://github.com/google/protobuf/archive/0b059a3d8a8f8aa40dde7bea55edca4ec5dfea66.tar.gz@d' tensorflow/workspace.bzl
添加依赖头文件 nccl.h (如编译1.7不用做此步骤)
下载 nccl.h，放在 third_party/nccl 文件夹内
修改 tensorflow/workspace.bzl 文件
tf_http_archive(
    name = "protobuf_archive",
    urls = [
        "https://mirror.bazel.build/github.com/google/protobuf/archive/396336eb961b75f03b25824fe86cf6490fb75e3a.tar.gz",
        "https://github.com/google/protobuf/archive/396336eb961b75f03b25824fe86cf6490fb75e3a.tar.gz",
    ],
    sha256 = "846d907acf472ae233ec0882ef3a2d24edbbe834b80c305e867ac65a1f2c59e3",
    strip_prefix = "protobuf-396336eb961b75f03b25824fe86cf6490fb75e3a",
)
搜索如上替换为如下
tf_http_archive(
    name = "protobuf_archive",
    urls = [
        "https://mirror.bazel.build/github.com/dtrebbien/protobuf/archive/50f552646ba1de79e07562b41f3999fe036b4fd0.tar.gz",
        "https://github.com/dtrebbien/protobuf/archive/50f552646ba1de79e07562b41f3999fe036b4fd0.tar.gz",
    ],
    sha256 = "eb16b33431b91fe8cee479575cee8de202f3626aaf00d9bf1783c6e62b4ffbc7",
    strip_prefix = "protobuf-50f552646ba1de79e07562b41f3999fe036b4fd0",
)
修复 third_party/gpus/cuda/BUILD.tpl 文件 -lgomp 报错
linkopts = ["-lgomp"],
搜索如上，注释掉
# linkopts = ["-lgomp"],
开始编译
编译配置
在 TensorFlow 目录下输入以下命令进行命令配置
./configure
配置文件如下
You have bazel 0.10 installed.
Please specify the location of python. [Default is /Users/user/.pyenv/versions/tensorflow-gpu/bin/python]: 


Found possible Python library paths:
  /Users/user/.pyenv/versions/tensorflow-gpu/lib/python3.6/site-packages
Please input the desired Python library path to use.  Default is [/Users/user/.pyenv/versions/tensorflow-gpu/lib/python3.6/site-packages]

Do you wish to build TensorFlow with Google Cloud Platform support? [Y/n]: n
No Google Cloud Platform support will be enabled for TensorFlow.

Do you wish to build TensorFlow with Hadoop File System support? [Y/n]: n
No Hadoop File System support will be enabled for TensorFlow.

Do you wish to build TensorFlow with Amazon S3 File System support? [Y/n]: n
No Amazon S3 File System support will be enabled for TensorFlow.

Do you wish to build TensorFlow with Apache Kafka Platform support? [y/N]: n
No Apache Kafka Platform support will be enabled for TensorFlow.

Do you wish to build TensorFlow with XLA JIT support? [y/N]: n
No XLA JIT support will be enabled for TensorFlow.

Do you wish to build TensorFlow with GDR support? [y/N]: n
No GDR support will be enabled for TensorFlow.

Do you wish to build TensorFlow with VERBS support? [y/N]: n
No VERBS support will be enabled for TensorFlow.

Do you wish to build TensorFlow with OpenCL SYCL support? [y/N]: n
No OpenCL SYCL support will be enabled for TensorFlow.

Do you wish to build TensorFlow with CUDA support? [y/N]: y
CUDA support will be enabled for TensorFlow.

Please specify the CUDA SDK version you want to use, e.g. 7.0. [Leave empty to default to CUDA 9.0]: 9.1


Please specify the location where CUDA 9.1 toolkit is installed. Refer to README.md for more details. [Default is /usr/local/cuda]: 


Please specify the cuDNN version you want to use. [Leave empty to default to cuDNN 7.0]: 


Please specify the location where cuDNN 7 library is installed. Refer to README.md for more details. [Default is /usr/local/cuda]:


Please specify a list of comma-separated Cuda compute capabilities you want to build with.
You can find the compute capability of your device at: https://developer.nvidia.com/cuda-gpus.
Please note that each additional compute capability significantly increases your build time and binary size. [Default is: 3.5,5.2]6.1


Do you want to use clang as CUDA compiler? [y/N]: n
nvcc will be used as CUDA compiler.

Please specify which gcc should be used by nvcc as the host compiler. [Default is /usr/bin/gcc]: 


Do you wish to build TensorFlow with MPI support? [y/N]: n
No MPI support will be enabled for TensorFlow.

Please specify optimization flags to use during compilation when bazel option "--config=opt" is specified [Default is -march=native]: 


Would you like to interactively configure ./WORKSPACE for Android builds? [y/N]: 
Not configuring the WORKSPACE for Android builds.

Preconfigured Bazel build configs. You can use any of the below by adding "--config=<>" to your build command. See tools/bazel.rc for more details.
--config=mkl         # Build with MKL support.
--config=monolithic  # Config for mostly static monolithic build.
Configuration finished
编译
bazel clean --expunge
bazel build --config=cuda --config=opt --cxxopt="-D_GLIBCXX_USE_CXX11_ABI=0" --action_env PATH --action_env LD_LIBRARY_PATH --action_env DYLD_LIBRARY_PATH //tensorflow/tools/pip_package:build_pip_package
如果看到
INFO: Build completed successfully, 9160 total actions
就说明编译成功
创建wheel文件并安装
bazel-bin/tensorflow/tools/pip_package/build_pip_package /tmp/tensorflow_pkg
cd ~
sudo pip install /tmp/tensorflow_pkg/tensorflow-1.8-cp36-cp36m-macosx_10_13_x86_64.whl
本人编译完成后的文件为 tensorflow-1.8.0-cp36-cp36m-macosx_10_7_x86_64.whl 百度云下载
最后提供本人 Z270 + i7-7700k 的黑苹果 EFI
参考文章：
【tensorflow】macOS 10.13.4 编译 GPU 版本的 TensorFlow 1.8


Django报错 __init__() missing 1 required positional argument 'on_delete'
2017-12-23T01:01:42.000Z
Django 在更新到 2.0 后 报错如下
TypeError: __init__() missing 1 required positional argument: 'on_delete'
是因为在 Django 2.0 后，models.ForeignKey() 函数 和 models.OneToOneField() 中的 on_delete 参数不再默认为 CASCADE ，而是必须参数
官方文档：https://docs.djangoproject.com/en/1.11/ref/models/fields/#django.db.models.ForeignKey.on_delete
修改方法如下
修改之前
class BlogArticles(models.Model):
    title = models.CharField(max_length=300)
    author = models.ForeignKey(
        User,
        related_name="blog_posts",
    )
修改之后
class BlogArticles(models.Model):
    title = models.CharField(max_length=300)
    author = models.ForeignKey(
        User,
        related_name="blog_posts",
        on_delete=models.CASCADE,
    )



远程开机_网络唤醒设置方法 (WOL, Wake on Lan)
2017-12-09T01:01:42.000Z
最近在实验室想控制家里的电脑。控制很容易， TeamViewer 就好啦。但是白天家里没人，没人帮我开电脑，于是找到了 WOL 这种方法。
设置主板 BIOS
需要在 BIOS 中进行更改。我的是微星 BIOS，操作如下
高级 -> 换型事件设置 -> 将 PCIE设备唤醒 和 网络唤醒 设置为 允许 (Enable)
其他 BIOS 也类似，因为网卡也属于 PCIE 设备，所以 PCIE设备唤醒 也需要打开。
设置网卡
在设备驱动管理器中，找到 网络适配器 ，在第一个驱动 右键 -> 属性
在 高级 菜单中的属性找到 唤醒魔包 (Wake on Magic Packet) 设置为 启用
在 电源管理 中 勾选 允许此设备唤醒计算机
配置路由器 DDNS (动态 DNS) 服务
由于 IPV4 地址紧张，运营商宽带都是使用的动态 IP 地址，这就需要 动态 DNS 服务 进行穿透局域网。
我家的路由器是 网件 NETGEAR R7800 所以这里使用 NETGEAR 的 DDNS 服务，其他路由器基本也有自己的 DDNS 服务，大家可以自己选择。
首先登录路由器控制界面，一般是浏览器输入 192.168.0.1 / 192.168.1.1 / 10.0.0.1 等进入。
找到 DDNS 或者 动态 DNS ，注册 DDNS 服务商。网件提供三个 DDNS 服务商，我选择的是 www.No-IP.com。
找到 端口映射/端口触发，在 端口映射 中 添加自定义服务。
服务名随便填，协议：TCP/UDP，外部端口组 和 内部端口组 一致即可，内部 IP 地址映射到家里电脑的 IP。
这样，你就可以使用 WOL 软件发送一个数据包唤醒家里的电脑了。
有一个网站就可以使用 https://www.depicus.com/wake-on-lan/woli。
该网站还提供了 windows, mac OS, Android, iOS 等不同平台的应用，有需要的可以自行下载。
mac 地址可以在控制台输入 ipconfig /all 获取；
IP 地址填 域名即可；
子网掩码为 255.255.255.255；
端口号为之前设的外部和内部端口号。


【翻译】 Is attacking machine learning easier than defending it?
2017-11-29T01:01:42.000Z
原文：Is attacking machine learning easier than defending it?
译文：攻击机器学习比防御更容易吗?
原文写作日期：2017年3月15日 译文写作日期：2017年11月29日
本文为cleverhans-blog的第二篇博客，作者为 Ian Goodfellow 和 Nicolas Papernot，主要讲解 对抗性训练 和 防御性蒸馏 两种防御方法之间的优势与不足。
xunge 是一名初学者，论文翻译中用到了 Google，并自己逐句检查过，但还是会有显得晦涩的地方，如有语法/专业名词翻译错误，还请见谅，并欢迎及时指出。
转载请注明出处！
在我们的第一篇文章中，我们提出了几种攻击者可以打破当前机器学习系统的方式，比如通过毒化学习算法使用的数据[BNL12]，或者制作对抗性样本迫使模型做出错误的预测[SZS13]。在本文中，我们将以对抗性样本为例说明为什么攻击机器学习似乎比防御更容易。换句话说，我们将详细介绍为什么我们还没有完全有效的防御对抗性样本的一些原因，并推测我们是否能够进行防御。
对抗性样本是机器学习模型的输入，它是由攻击者设计，用来欺骗模型产生不正确的输出。例如，我们给一个熊猫图片添加一个经过计算的小扰动，使图像被认为是一个高可信度的长臂猿[GSS14]：
到目前为止，设计出这种欺骗模型的方法要比设计出不能欺骗模型的方法容易得多。
我们如何使ML模型面对对抗性样本时更加强壮？ (How have we tried to make ML models more robust to adversarial examples?)
我们先介绍下两种防御方法：对抗性训练和防御性蒸馏。防御者如何试图使机器学习模型更加强壮并减轻对抗性样本的攻击效果。
对抗性训练旨在训练时主动产生对抗性样本，在测试时提取对抗性样本来改进模型的泛化。这个想法是由Szegedy等人首次提出的[SZS13]，但由于产生对抗性样本的成本太高而不实用。 Goodfellow等人展示了如何利用快速梯度符号方法低成本地产生对抗性样本，并且使得在训练过程中高计算效率地产生大批对抗性样本 [GSS14]。然后该模型被训练成将相同的标签分配给相对于原始样本的对抗性样本。例如：我们拍摄一张猫的照片，并对其进行扰动以欺骗模型，使其认为它是秃鹫，然后告诉模型这张照片仍然是一只猫。对抗训练的一个开源实现可以在cleverhans 库中找到，其使用方法在下面的 教程 中有说明。
防御性蒸馏平滑模型的决策表面在对抗方向被攻击者利用。蒸馏是一种训练过程，其中一个模型被训练以预测由先前训练的另一个模型输出的概率。蒸馏最初由Hinton等人提出。在[HVD15]中，其目标是用一个小模型来模拟一个大型的、计算成本很高的模型。防御性蒸馏有一个不同的目标，即简单地使最终模型的反应更加平滑，所以即使两个模型的大小相同也能起作用。训练一个模型来预测另一个具有相同架构的模型输出看起来是违反直觉的。它的工作原理是，第一个模型是用“硬”标签（图像100％概率是狗而不是猫）训练，然后第二个模型用“软”标签（图像95％概率是狗而不是猫）训练。第二个蒸馏模型对于诸如快速梯度符号法[PM16]或基于雅可比行列式显著图法[PMW16]的攻击更为鲁棒。这两种攻击的实现也分别在这里 和这里的cleverhans 上提供。(已经404 。。2333)
一个失败的防御：“梯度掩蔽” (A failed defense: “gradient masking”)
大多数对抗性样本构建技术使用模型的梯度来进行攻击。换句话说，一张飞机的照片，他们测试在图像空间中往哪个方向移动使得图片识别为“猫”的概率增加，然后他们往那个方向进行移动（换句话说，扰乱了输入）。这样新修改后的图像被误认为是猫。
但是，如果没有梯度，如果对图像进行微小的修改不会导致模型的输出发生变化呢？这似乎提供了一些防御，因为攻击者不知道怎样去“推”图像。
我们可以很容易想到一些非常微不足道的方法来摆脱梯度。例如，大多数图像分类模型可以以两种模式运行：一种模式是输出最可能类别的标识，另一种模式是输出概率。如果模型的输出是“99.9％的飞机，0.1％的猫”，那么输入的一个微小的变化会给输出带来一个微小的变化，梯度告诉我们哪些变化会增加“猫”类的概率。如果我们在输出模式只是“飞机”的模式下运行模型，那么对输入的一个微小的变化根本不会改变输出，而梯度不会告诉我们任何事情。让我们做一个思考实验，如何通过以“最有可能的类”模式而不是“概率模式”运行它来防御对抗性样本。攻击者再也不能找到分类为猫的扰乱输入，所以我们可能会有一些防御。不幸的是，之前被归类为猫的图片现在仍被归类为猫。如果攻击者可以猜测哪些点是对抗性样本，这些点将仍然会被错误的分类。我们并没有使模型更加鲁棒，我们只是给了攻击者更少的线索来找出模型防御的漏洞。更不幸的是，事实证明攻击者有一个非常好的策略来猜测防御漏洞的位置。攻击者可以训练他们自己的模型，一个具有梯度的光滑模型，为他们的模型制作对抗性样本，然后将这些对抗性样本用于我们的非光滑模型。很多时候，我们的模型也会错误地分类这些样本。最后，我们的思想实验表明，隐藏梯度并没有达到我们的目的。
因此，我们称之为有缺陷的防御策略梯度掩蔽，这个术语在[PMG16]中有介绍。执行梯度掩蔽的防御策略通常导致在特定方向和训练点的邻域中模型变得非常平滑，这使得攻击者难以找到攻击方向的梯度去扰乱输入。然而，攻击者可以训练一个替代模型：一个模仿防御模型的副本，通过观察防御模型分配给攻击者输入的标签。[PMG16]中介绍了执行这种模型提取攻击的过程。然后攻击者可以使用替代模型的梯度来找到被防御模型错误分类的对抗性样本。在下面的图中，我们再现[PMS16]中对梯度掩蔽的讨论，我们用一维ML问题来说明这种攻击策略。对于高维问题，梯度掩蔽现象会加剧，但难以描述。
令人惊讶的是，我们发现对抗性训练和防御性蒸馏都意外地表现出一种梯度掩蔽。如果我们将对抗性样本从一个模型转移到另一个模型，并且用这些防御之一进行训练，即使对第二个模型的直接攻击会失败，攻击通常也会成功[PMG16]。这表明两种训练方法都能使模型变平滑和消除梯度，而不是确保对多个点进行正确地分类。
打“地鼠”游戏 (Playing a game of “whack-a-mole”)
在“隐藏梯度”的游戏中，我们看到梯度掩蔽并不是很好的防御。它防御使用梯度的攻击者，但是如果攻击者知道我们正在使用这种防御，那么他们只需要切换到移植攻击。在安全术语中，这意味着梯度掩蔽不是一种自适应防御。
迄今为止提出的大多数针对对抗性样本的防御措施根本不起作用，但是有效的那些并不是自适应的。这意味着就像他们在玩一个打地鼠游戏一样：他们关闭了一些漏洞，但是让其他人打开。
对抗训练需要选择算法来产生对抗性样本。通常情况下，这个模型被训练成可以抵抗在一个步骤中产生的低成本对抗性样本，例如快速梯度符号方法一样。经过训练能抵制这些低成本对抗性样本，这个模型通常能成功地抵制同类低成本的新对抗性样本。如果我们使用高成本的、迭代的对抗性样本，就像[SZS13]中的那些例子，那么模型通常就会被愚弄。
保证适应性是具有挑战性的。灵感可以从差异隐私的框架中得到，它提供了随机算法不会暴露个人用户隐私的正式保证。这一保证不会对攻击者的知识或能力做出假设，因此能够面对未来由攻击者设计的假想攻击。
为什么很难防御对抗性样本？ (Why is it hard to defend against adversarial examples?)
对抗性样本很难防御，因为很难构建对抗性样本制定过程的理论模型。对抗性样本是许多ML模型（包括神经网络）的非线性和非凸的优化问题的解决方案。由于我们没有很好的理论工具去描述这些复杂的优化问题的解决方案，所以很难做出任何一种防御理论来排除一系列对抗性样本。
从另一个角度来看，对抗性样本很难防御，因为它们需要机器学习模型来为每一个可能的输入生成好的输出。大多数情况下，机器学习模型工作得很好，但只能处理遇到所有可能输入中的很少一部分。
由于可能的输入的量非常巨大，设计出真正自适应的防御是非常困难的。
其他攻击和防御方法 (Other attack and defense scenarios)
其他几种对机器学习的攻击也是难以防御。在本文中，我们专注于试图混淆机器学习模型测试过程的输入。但是其他类型的攻击是可能的，例如基于暗中修改训练数据的攻击，使得模型学习攻击者希望它进行的行为。
对抗性机器学习的一个亮点是差分隐私，我们实际上有理论上的观点，即某些训练算法可以防止攻击者从训练好的模型中恢复关于训练集的敏感信息。
将机器学习与攻击和防御都可能的其他场景进行比较是有趣的。
在密码学中，防御者似乎有优势。给定一系列合理的假设，例如加密算法的正确实现，防御者可以可靠地发送攻击者无法解密的消息。
在物理冲突中，攻击者似乎有优势。建造核弹比建造一个能够承受核爆的城市要容易得多。热力学的第二定律似乎意味着，如果防御要求将熵维持在某个阈值以下，那么即使没有明确的攻击者有意引起这种熵的增加，防御者也必然随着时间熵增加而最终失去。
监督学习的“没有免费午餐定理”[W96]指出，在所有可能的数据集进行平均，没有任何机器学习算法在测试时间的新点上比其他算法更好。乍一看，这似乎表明，所有的算法都同样容易受到对抗性样本。然而，“没有免费午餐定理”只适用于我们对问题结构不作假设的情况。当我们研究对抗性样本时，我们假设输入的小扰动不应该改变输出类别，所以一般形式的“没有免费午餐定理”并不适用。
正式揭露攻击者的鲁棒性和对清洁数据的模型表现之间的矛盾关系仍然是一个活跃的研究问题。在[PMS16]中，针对机器学习的对抗性样本的第一个“没有免费午餐定理”表明，在从有限的数据中学习时存在这样的矛盾。结果表明，防御者可以通过转向更丰富的假设类别来阻挠对抗性样本。然而，这种矛盾关系是由于没有合适的数据和学习算法来学习高保真模型所面临的挑战。
总结
对抗性样本的研究是令人兴奋的，因为许多最重要的问题在理论和应用方面都是开放的。在理论上，还没有人知道防御对抗性样本是否是一个理论上没有希望的努力（如试图找到一个通用的机器学习算法），或者是否存在一个最优策略会使防御者更有利。（如在密码学和差分隐私）。在应用方面，还没有人设计出真正强大的防御算法，可以抵抗各种对抗性样本的攻击算法。我们希望我们的读者能够得到启发，解决其中的一些问题。
References
[BNL12] Biggio, B., Nelson, B., & Laskov, P. (2012). Poisoning attacks against support vector machines. arXiv preprint arXiv:1206.6389.
[GSS14] Goodfellow, I. J., Shlens, J., & Szegedy, C. (2014). Explaining and harnessing adversarial examples. arXiv preprint arXiv:1412.6572.
[HVD15] Hinton, Geoffrey, Oriol Vinyals, and Jeff Dean. “Distilling the knowledge in a neural network.” arXiv preprint arXiv:1503.02531 (2015).
[PM16] Papernot, N., & McDaniel, P. (2016). On the effectiveness of defensive distillation. arXiv preprint arXiv:1607.05113.
[PMG16] Papernot, N., McDaniel, P., Goodfellow, I., Jha, S., Berkay Celik, Z., & Swami, A. (2016). Practical Black-Box Attacks against Deep Learning Systems using Adversarial Examples. arXiv preprint arXiv:1602.02697.
[PMS16] Papernot, N., McDaniel, P., Sinha, A., & Wellman, M. (2016). Towards the Science of Security and Privacy in Machine Learning. arXiv preprint arXiv:1611.03814.
[PMW16] Papernot, N., McDaniel, P., Wu, X., Jha, S., & Swami, A. (2016, May). Distillation as a defense to adversarial perturbations against deep neural networks. In the 2016 IEEE Symposium on Security and Privacy (pp. 582-597).
[SZS13] Szegedy, C., Zaremba, W., Sutskever, I., Bruna, J., Erhan, D., Goodfellow, I., & Fergus, R. (2013). Intriguing properties of neural networks. arXiv preprint arXiv:1312.6199.
[W96] Wolpert, David H. (1996). The lack of a priori distinction between learning algorithms. Neural Computation


Windows 下 MySQL 绿色版安装详细教程
2017-10-17T01:01:42.000Z
MySQL 绿色版安装详细操作步骤。
MySQL 绿色版优点是安装时间短，可在一部电脑兼容多个版本的 MySQL。
1. 下载。
下载地址：http://downloads.mysql.com/archives/get/file/mysql-5.7.11-winx64.zip
可以复制链接使用迅雷下载，速度较快。
2. 解压 MySQL 压缩包
解压到指定目录，我的是 “C:.11-winx64”
3. 修改配置文件
将解压目录中的 my-default.ini 文件重命名为 my.ini，并将内容替换为以下即可
[mysqld]
# 注意：路径是反斜线，也可以改为两个正斜线，还可以加上双引号
# 设置mysql的安装目录
basedir = C:\MySQL\mysql-5.7.11-winx64
# 设置 mysql 数据库的数据的存放目录，必须是 data
datadir = C:\MySQL\mysql-5.7.11-winx64\data
# mysql端口
port = 3306

sql_mode = NO_ENGINE_SUBSTITUTION,STRICT_TRANS_TABLES

# 服务端编码格式
character_set_server = utf8

# 不加这句话可能报错
innodb_flush_method = normal
4. 安装MySQL服务
以管理员身份运行 cmd
:: 进入 `C:\MySQL\mysql-5.7.11-winx64\bin` 目录下，
cd C:\MySQL\mysql-5.7.11-winx64\bin

:: 安装 MySQL 服务
mysqld -install
:: 显示 “Service successfully installed.” 即成功

:: 初始化 MySQL (若安装目录有 data 文件夹则删除)
mysqld --initialize

:: 启动 MySQL 服务
net start mysql
:: 显示 “MySQL 服务正在启动 .”
:: 显示 “MySQL 服务已经启动成功。”
:: 若启动失败，在任务管理器中找到 “mysqld.exe” 进程，并删除
5. 更改默认密码
打开 MySQL 安装目录，打开 data 目录，有一个 .err 后缀名的文件，用编辑器打开
如果每一行都是 [Warning]，没有 [Error]，就说明安装正确，并且最后一行应该如下
[Note] A temporary password is generated for root@localhost: oK-R(foa>4by
后面 12 个字符为默认生成初始密码，复制
打开 cmd ，输入以下命令
mysql -u root -p
:: 显示 “Enter password:” 后粘贴密码
若出现 “Welcome to the MySQL monitor. Commands end with ; or . ...” 则说明密码正确
若出现 “ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)” 则说明密码错误，编辑 MySQL 配置文件 my.ini ，在 [mysqld] 这个条目下加入 skip-grant-tables，保存退出后重启 MySQL
密码正确后更改默认密码
mysql> ALTER USER 'root'@'localhost' IDENTIFIED BY 'newPassword';
newPassword 更改为新密码
6. 卸载 MySQL 服务
进入 C:\MySQL\mysql-5.7.11-winx64\bin 目录下，输入
mysqld -remove
或者
sc delete mysql
执行卸载服务。


《跟老齐学 Python 轻松入门》学习笔记--1.基本对象类型
2017-10-05T01:01:42.000Z
本文根据 《跟老齐学python轻松入门》 的知识点整理，主要是代码打了一遍做了总结，非常零基础。
数和数的运算
id()   # 查看每个对象的内存地址
help() # 查看其它函数文档
type() # 查看对象类型
dir()  # 查看模块中函数名称
python 自动解决大整数问题
加法
>>> 4.0 + 2
6.0
乘法
# 9^2
>>> 9 ** 2
81

# 2 * 10^3
>>> 2e3
2000.0
除法
>>> 5 / 2
2.5

>>> 5 // 2
2
异常计算
浮点数十进制转化为二进制造成误差 
>>> 10.0 / 3
3.3333333333333335
解决方法1：使用 decimal 模块(小数)
>>> import decimal
>>> a = decimal.Decimal("10.0")
>>> b = decimal.Decimal("3")
>>> a / b
Decimal('3.333333333333333333333333333')
解决方法1：使用 fractions 模块(分数)
>>> from fractions import Fraction  
# fractions 是一个大模块(库)，
# 只想用其中的子模块 Fraction
>>> Fraction(10, 3)
Fraction(10, 3)
>>> Fraction(10, 8)
Fraction(5, 4)
余数
>>> 5 % 2
1

>>> 5.0 % 2
1.0
>>> 

>>> divmod(5, 2)
(2, 1) # 返回商和余数
四舍五入
>>> round(1.23456, 2)
1.23
浮点数十进制转化为二进制造成误差
>>> round(1.2345, 3)
1.234  # 应该是 1.235

>>> round(2.235, 2)
2.23   # 应该是 2.24
math 模块
>>> import math
>>> math.pi
3.141592653589793

>>> 4 ** 2
16

>>> math.pow(4, 2)
16.0

>>> math.sqrt(9)
3.0

>>> math.floor(3.14)
3

>>> math.floor(3.92)
3

>>> math.fabs(-2)
2.0

>>> abs(-2)
2

>>> math.fmod(5, 3)
2.0

>>> 5 % 3
2
字符串
键盘输入
# input() 函数进行输入赋值
>>> age = input("how old are you?")
how old are you?10  # 提示输入内容，通过键盘输入10
>>> age
'10'
>>> type(age)

原始字符串
>>> dos = "c:\news"
>>> print(dos)
c:
ews
>>> dos = "c:\\news"  # 转义字符解决
>>> print(dos)
c:\news
>>> print(r"c:\news") # r 开头的字符串是原始字符串
c:\news
字符串切片
>>> lang = 'study python'
>>> b = lang[1:]
>>> b
'tudy python'
>>> c = lang[:]
>>> c
'study python'
>>> d = lang[:10]
>>> d
'study pyth'
>>> e = lang[0:10]
>>> e
'study pyth'
>>> f = lang[1:12]
>>> f
'tudy python'
连接字符串
>>> "py" + "thon"
'python'

>>> a = 1996
>>> b = "xunge"
>>> a + b
Traceback (most recent call last):
  File "", line 1, in 
TypeError: unsupported operand type(s) for +: 'int' and 'str'
>>> str(a) + b
'1996xunge'
>>> repr(a) + b
'1996xunge'

# str() 与 repr() 区别:
# str() 转化后的结果更适合与人进行交互
# repr()转化后的结果则可以被 Python的 解释器阅读
>>> s = 'xunge \n'
>>> str(s)
'xunge \n'
>>> repr(s)
"'xunge \\n'"
>>> print(str(s))
xunge 

>>> print(repr(s))
'xunge \n'
>>>
判断元素是否在字符串中
>>> str = "python"
>>> "th" in str
True
最值和比较
>>> max(str)
'y'
>>> min(str)
'h'
>>> ord('y') # 字符转化为编码
121
>>> chr(121) # 编码转化为字符
'y'
测量长度
>>> len(str)
6
字符串格式化输出
>>> "I love %s" % "gong yu xin"
'I love gong yu xin'
>>> "I love {0}.{1}.{2}".format("gong", "yu", "xin")
'I love gong.yu.xin'
>>> "I love {0:8}.{1:>8}.{2:^8}".format("gong", "yu", "xin")
'I love gong    .      yu.  xin   '
>>> "I love {0:.2}.{1:>8.2}.{2:^4.2}".format("gong", "yu", "xin")
'I love go.      yu. xi '

>>> "She is {0:d} years old and {1:f}cm".format(21, 175.1221)
'She is 21 years old and 175.122100cm'
>>> "She is {0:4d} years old and {1:7.2f}cm".format(21, 175.1221)
'She is   21 years old and  175.12cm'
>>> "She is {0:04d} years old and {1:07.2f}cm".format(21, 175.1221)
'She is 0021 years old and 0175.12cm'

>>> "I like {lang} and {name}".format(lang = "python", name = "gongyuxin")
'I like python and gongyuxin'
>>> data = {"name":"gongyuxin", "age":21}
>>> "{name} is {age}".format(**data)
'gongyuxin is 21'
常用字符串方法
# 判断是否全是字母
>>> "python".isalpha()
True
>>> "python2".isalpha()
False

# 根据分隔符分割字符串
>>> s = "I love gong yu xin"
>>> s.split(" ")
['I', 'love', 'gong', 'yu', 'xin']

# 去掉字符串两头的空格
>>> s.strip()  # 去掉两边空格
'gong'
>>> s.lstrip() # 去掉左边空格
'gong '
>>> s.rstrip() # 去掉右边空格
' gong'

# 字符大小写转换
>>> a = "gong yu xin"
>>> b = a.upper()  # 小写字母转换为大写字母
>>> b
'GONG YU XIN'
>>> a
'gong yu xin'      # 原对象未变
>>> c = b.lower()  # 大写字母转换为小写字母
>>> c
'gong yu xin'
>>> c.capitalize() # 把字符串的第一个字母变成大写
'Gong yu xin'
>>> d = a.title()  # 每个单词首字母大写
>>> d
'Gong Yu Xin'
>>> a.islower()
True
>>> b.isupper()
True
>>> c.islower()
True
>>> d.istitle()
True

# join() 拼接字符串
>>> b = "www.xungejiang.com"
>>> c = b.split(".")
>>> c
['www', 'xungejiang', 'com']
>>> ".".join(c)
'www.xungejiang.com'
列表
列表切片
>>> a = ['gong', 831, 'xungejiang.com']
>>> a[1:]
[831, 'xungejiang.com']
>>> a[2][11:14]
'com'

# -1 是右边第一个
>>> a[-1]
'xungejiang.com'
>>> a[-3:-1]    # a[(3-3):(3-1)] = a[0:2]
['gong', 831]

# 完整写法 seq[start:end:step]
>>> alst = [1, 2, 3, 4, 5, 6]
>>> alst[::2]
[1, 3, 5]
>>> alst[::1]
[1, 2, 3, 4, 5, 6]
>>> alst[::-1]   # 反转
[6, 5, 4, 3, 2, 1]
>>> alst[::-2]
[6, 4, 2]

# 使用 reversed() 函数将原来序列对象反转
# 使用 list() 函数将迭代对象转换为列表显示
>>> list(reversed(alst))
[6, 5, 4, 3, 2, 1]
>>> list(reversed("abcd"))
['d', 'c', 'b', 'a']
列表基本操作
>>> lst = ['jiang', 'xun', 'zhi']
# len() 列表长度
>>> len(lst)
3
>>> alst = ['gong', 'yu', 'xin']
# "+" 连接两个序列
>>> lst + alst
['jiang', 'xun', 'zhi', 'gong', 'yu', 'xin']
# "*" 重复序列元素
>>> lst * 3
['jiang', 'xun', 'zhi', 'jiang', 'xun', 'zhi', 'jiang', 'xun', 'zhi']
# 序列是否包含该元素
>>> "jiang" in lst
True
# 按照元素字典顺序进行比较
>>> max(lst)
'zhi'
>>> min(lst)
'jiang'

# 修改列表元素
# list.append(x) 向列表中追加元素 x
>>> cities = ['harbin', 'changchun']
>>> cities[1] = 'beijing'
>>> cities
['harbin', 'beijing']
>>> cities.append('shanghai')
>>> cities
['harbin', 'beijing', 'shanghai']

# list.extend([L]) 向列表中追加列表 L 的元素
>>> la = [1, 2, 3]
>>> lb = ['jiang', 'gong']
>>> la.extend(lb)
>>> la
[1, 2, 3, 'jiang', 'gong']
>>> lb
['jiang', 'gong']

# append() 和 extend() 的区别
# append() 是整建制的追加
# extend() 是个体化扩编
>>> alst = [1, 2, 3]
>>> blst = [1, 2, 3]
>>> clst = ["jiang", "gong"]
>>> alst.append(clst)
>>> alst
[1, 2, 3, ['jiang', 'gong']]
>>> len(alst)
4
>>> blst.extend(clst)
>>> blst
[1, 2, 3, 'jiang', 'gong']
>>> len(blst)
5

# list.count(x) x 元素出现次数
>>> la = [1, 2, 2, 1, 3, 1]
>>> la.count(1)
3

# list.insert(i, x) 将 x 插入到索引是 i 的元素前面
>>> lst = ["gong", "xin"]
>>> lst.insert(1, "yu")
>>> lst
['gong', 'yu', 'xin']

# list.remove(x) 删除第一次出现的 x 元素，无返回值
>>> lst = ["python", "c++", "python", "java"]
>>> lst.remove("python")
>>> lst
['c++', 'python', 'java']

# list.pop([i]) 删除索引为 i 的元素，并将删除元素作为返回值。
# i 为空则删除列表最后一个
>>> lst.pop(1)
'python'
>>> lst
['c++', 'java']

# list.reverse(L) 将元素顺序反转，不返回值
>>> a = [8, 3, 1, 4, 3, 0]
>>> a.reverse()
>>> a
[0, 3, 4, 1, 3, 8]
# reversed(L) 实现对列表的反向迭代
>>> b = reversed(a)
>>> list(b)
[8, 3, 1, 4, 3, 0]
>>> b


# list.sort() 对列表进行排序
>>> a.sort()
>>> a
[0, 1, 3, 3, 4, 8]
# 从大到小排序
>>> a.sort(reverse = True)
>>> a
[8, 4, 3, 3, 1, 0]
# 按字符串长度排序
>>> lst = ["java", "python", "c++", "basic", "pascal"]
>>> lst.sort(key = len)
>>> lst
['c++', 'java', 'basic', 'python', 'pascal']



群晖 synology 的 SHR 、raid1 、raid0 、raid1 、raid5 的区别
2017-08-03T01:01:42.000Z
参考资料 http://www.goodnas.net/forum.php?mod=viewthread&tid=24
本文主要讲述群晖的 SHR 、raid1 、raid0 、raid1 、raid5 之间的区别。
SHR
SHR 是 Synology Hybrid RAID 的缩写；当NAS里面只有一颗硬盘的时候，磁盘阵列的模式为 basic ，无数据保护。当再添加为一个硬盘的时候磁盘阵列的模式自动转换成类似 raid1 模式，空间大小不变，但是多了个数据保护。当再加入一个硬盘的时候会自动转换成类似 raid5 模式（前提是你的NAS可以放3个及以上的硬盘），容量为 N-1 个硬盘的总容量，假如 3 个 3Ｔ 的硬盘，此时的SHR空间总容量为 (3 - 1) * 3T 为 6T 的空间，后期可以慢慢加硬盘数据也不影响的。
SHR 优点：在于方便不熟悉磁盘阵列的玩家，傻瓜简单式的帮你组好磁盘阵列，而且还能合理利用容量大小不一的硬盘，减少浪费，raid 是按照最小的硬盘算，而 SHR 则可以合理利用减少浪费，智能 raid 推荐使用~
附计算网址：https://www.synology.cn/zh-cn/support/RAID_calculator。
basic
basic 是基本模式，一个硬盘一个独立的空间。
raid0
raid0：无数据保护，空间最大化利用，当在NAS中运行的时候就和JBOD属性差不多，就不再多介绍，raid0是将多个磁盘合并成一个大的磁盘，不具有冗余，并行 I / O，速度最快。它是将多个磁盘并列起来，成为一个大磁盘。
raid0 优点：传输速度快且空间最大化利用，传输速度理论数值是一般raid的2倍，实际速度为1.6倍。
raid0 缺点：没有冗余，数据存入都是以拆分打散的方式放到不同的硬盘，所以说当一块硬盘坏掉的时候所以的数据都会丢失！慎用~
raid1
raid1 是镜像备份，实际容量为总空间的一半，N/2，如果有2块3T的硬盘，总容量为（3+3）/2。
raid1 优点：有数据保护，让硬盘坏掉一个时，数据还在，硬盘还可以正常读取。
rard1 缺点：空间折一半，放放重要数据资料，照片，放电影就不划算啦！
raid5
raid5 是一种既考虑到数据保护又考虑到硬盘运作成本的解决方案，raid5不对数据进行存储，而是把奇偶校检信息存储到不同的磁盘上。损坏后，用奇偶校检信息和对应的数据去恢复损坏的数据，实际空间为 N-1 ，上面有介绍，假如有3块3T的硬盘，实际空间为 ( 3 - 1 ) * 3T 为 6T ，说直白点：就是假如4个硬盘，3个放数据，1个备份，值得强调的一点就是4个硬盘不分主次，可以任意坏一块硬盘。
raid5 优点：数据安全和成本兼顾，是4盘位NAS玩家的首选。
raid5 缺点：只有一个硬容错，当硬盘坏掉一个是要及时更换。
raid6
raid6 和 riad5 原理差不多，riad5 是 N - 1 可以任意坏一个硬盘，raid6 则是可以任意坏 2 个硬盘，N - 2 的模式，适合盘位很多的玩家。
还有 raid2、raid3、raid4、raid6、raid7、raid50、raid53，NAS不支持，感兴趣的朋友可自行百度。


群晖 NAS 简单体验
2017-07-31T01:01:42.000Z
好吧，最近家人出去玩不带我，自己在家无聊买了一个 群晖（Synology）DS216play ，2017-7-29 京东购买，下午就到了，狗东物流就是快啊。
买的是带 两块 希捷 4T 硬盘的套装，一共 3799 元。单买是 (2250 + 1299 * 2) = 4848 元，相当于赠了一块硬盘，还算挺合适的，当然比 618 贵 100+ 。
NAS (Network Attached Storage) 网络附属存储，也叫网络存储器，是专门用来存储数据的服务器，家用的主要功能其实就是私有云、照片电影的存储等。在各大网盘都被封掉的时代，买一个 NAS 存放一些私有文件还是一个比较好的选择。
传说中群晖是买软件送硬件，一是说群晖性价比低，二是说群晖软件做的确实良心，各大平台都有，插件也比较全，可玩性比较高。
配置 群晖
DS216play 是双硬盘位，不支持热插拔硬盘位。个人认为双盘位在家庭中使用足够了，8T (4T * 2) 的硬盘也够使好长时间了。
把两个硬盘装好后，拧上螺丝，插上电源和网线(连路由器或交换机的 LAN 口)，按下电源键就可以开机啦~
在连接网络的电脑浏览器输入网址 http://find.synology.com 进行初次配置，设置群晖账号密码等。
之后会提示你安装推荐插件，先点取消，因为我们还要更改一下 RAID 格式。
选择 RAID 类型
详细的 shr basic raid0 raid1 raid5 raid6 类型介绍参照下面的链接 http://xungejiang.com/2017/08/03/shr-raid015/
安装完系统后默认为 shr 格式，双盘位时为 raid1 模式，多了数据备份功能，但是容量只有一半，也就是说 2 块 4T 的硬盘只有 4T 的容量。由于是家庭使用，没有太重要的文件，所以没必要进行数据备份，需要把 shr 模式改为 basic 模式，这样可用容量才是 8T。
具体方法如下。
如果 NAS 里已经有一些重要的资料不想拿另一个硬盘备份，可以参照这篇博客 如何将raid1（SHR）降级为basic。
不过如果你已经把资料都备份了，推荐恢复出厂设置。方法如下：
控制面板 -> 更新和还原 -> 重置 -> 删除所有数据。
如果你已经安装过插件，不建议你选择 删除存储空间 进行重置，因为插件容易卸载不干净，影响后续使用。所以最好的方法还是恢复出厂设置。
变为新系统后，在 存储空间管理员 -> 存储空间 -> 删除 -> 删除 将系统默认的 shr 删掉。
之后点 新增 -> 自定义 -> 使用所有硬盘容量的存储空间 -> 勾选第一个硬盘 -> 确定 -> Basic -> 否 -> 下一步 -> 应用
        
同理，第二块硬盘重复上述操作，只是在第四步勾选第二块硬盘。
套件中心 初体验
群晖的软件可谓是真的良心，很多插件都已经集成，可直接下载，兼容性很强。
存储空间分析器：可查看文件类型、重复文件等。
Cloud Station Server：可下载 Cloud Station Drive 和 Cloud Station Backup 两个客户端，区别是 Drive 是 双向同步，保证云端和本地一致；而 Backup 只有新增才会同步，删除本地云端不会删除。
Cloud Sync：可同步各大网盘，以 百度网盘 为例，配置好后，只要将文件保存至 我的应用数据 -> Cloud Sync 里即可自动下载到 NAS 中，不过速度较慢
Download Station：远程下载，不过速度较慢。由于迅雷取消了第三方软件的远程下载，只有迅雷的下载包和小米路由器可以使用，所以群晖的远程下载也被取消，远程下东西只能用 Download Station 和 同步云盘。


SSM 框架下的 jcaptcha 验证码实例
2017-07-11T01:01:42.000Z
最近把 SSM(Spring + Spring MVC + MyBatis) 的 Maven 项目搭建好了，并完成了登录和注册功能。其中注册功能使用 jcaptcha 加入了验证码，并使用 AJAX 完成了基本的验证功能。
本文主要介绍一下 jcaptcha 验证码的实现 (IDEA , 附源码)。
项目源码：
https://github.com/xunge/SSM-jcaptcha
参考：
jcaptcha 官网
IDEA 搭建 SSM
jcaptcha 验证码
由于 jcaptcha 有个缺陷，就是无法使用 AJAX 进行验证，因为一旦验证就会清除 session，这就导致如果使用 AJAX 验证后，如果输入的验证码错误，就无法重复验证，只有刷新网页才可重新使用。
这里参考 这篇博客，将清除 session 的操作提取出来，便可以使用 AJAX 进行验证了。
项目介绍
注册页面使用 jcaptcha 实现了验证码功能，并使用AJAX技术实时验证。
注册页面的邮箱输入完成，光标移开输入框后，使用AJAX技术到后台数据库进行查找，如果已经注册过则提示该邮箱已被注册。
maven 依赖
<dependency>
    <groupId>com.octo.captchagroupId>
    <artifactId>jcaptcha-allartifactId>
    <version>1.0-RC6version>
    <exclusions>
        <exclusion>
            <groupId>quartzgroupId>
            <artifactId>quartzartifactId>
        exclusion>
        <exclusion>
            <groupId>commons-dbcpgroupId>
            <artifactId>commons-dbcpartifactId>
        exclusion>
        <exclusion>
            <groupId>commons-poolgroupId>
            <artifactId>commons-poolartifactId>
            exclusion>
        <exclusion>
            <groupId>hsqldbgroupId>
            <artifactId>hsqldbartifactId>
        exclusion>
        <exclusion>
            <groupId>net.sf.ehcachegroupId>
            <artifactId>ehcacheartifactId>
        exclusion>
        <exclusion>
            <groupId>concurrentgroupId>
            <artifactId>concurrentartifactId>
        exclusion>
        <exclusion>
            <groupId>org.springframeworkgroupId>
            <artifactId>springartifactId>
        exclusion>
        <exclusion>
            <groupId>xercesgroupId>
            <artifactId>xercesImplartifactId>
        exclusion>
        <exclusion>
            <groupId>xercesgroupId>
            <artifactId>xmlParserAPIsartifactId>
        exclusion>
    exclusions>
dependency>
jcaptcha 配置文件：spring-jcaptcha.xml
在 resources/spring 下新建 spring-jcaptcha.xml 。
该文件主要控制验证码的样式，可根据官网适当修改。

<beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xsi:schemaLocation="http://www.springframework.org/schema/beans http://www.springframework.org/schema/beans/spring-beans-3.0.xsd"
       default-lazy-init="true">

    
    
    <bean id="captchaService" class="com.xunge.springemp.service.impl.CustomGenericManageableCaptchaService">
        <constructor-arg index="0"><ref bean="imageEngine"/>constructor-arg>
        <constructor-arg index="1"><value>180value>constructor-arg>
        <constructor-arg index="2"><value>180000value>constructor-arg>
    bean>

    <bean id="imageEngine" class="com.octo.captcha.engine.GenericCaptchaEngine">
        <constructor-arg index="0">
            <list>
                <ref bean="captchaFactory"/>
            list>
        constructor-arg>
    bean>

    <bean id="captchaFactory" class="com.octo.captcha.image.gimpy.GimpyFactory">
        <constructor-arg>
            <ref bean="wordgen"/>
        constructor-arg>
        <constructor-arg>
            <ref bean="wordtoimage"/>
        constructor-arg>
    bean>

    <bean id="wordgen" class= "com.octo.captcha.component.word.wordgenerator.RandomWordGenerator">
        
        <constructor-arg>
            <value>aabbccddeefgghhkkmnnooppqqsstuuvvwxxyyzzvalue>
        constructor-arg>
    bean>

    <bean id="wordtoimage" class="com.octo.captcha.component.image.wordtoimage.ComposedWordToImage">
        <constructor-arg index="0">
            <ref bean="fontGenRandom"/>
        constructor-arg>
        <constructor-arg index="1">
            <ref bean="backGenUni"/>
        constructor-arg>
        <constructor-arg index="2">
            <ref bean="decoratedPaster"/>
        constructor-arg>
    bean>

    <bean id="fontGenRandom" class="com.octo.captcha.component.image.fontgenerator.RandomFontGenerator">
        
        <constructor-arg index="0">
            <value>26value>
        constructor-arg>
        
        <constructor-arg index="1">
            <value>34value>
        constructor-arg>
        <constructor-arg index="2">
            <list>
                <bean class="java.awt.Font">
                    <constructor-arg index="0"><value>Arialvalue>constructor-arg>
                    <constructor-arg index="1"><value>0value>constructor-arg>
                    <constructor-arg index="2"><value>32value>constructor-arg>
                bean>
            list>
        constructor-arg>
    bean>
    <bean id="backGenUni" class="com.octo.captcha.component.image.backgroundgenerator.UniColorBackgroundGenerator">
        
        <constructor-arg index="0">
            <value>110value>
        constructor-arg>
        
        <constructor-arg index="1">
            <value>50value>
        constructor-arg>
    bean>

    <bean id="decoratedPaster" class="com.octo.captcha.component.image.textpaster.DecoratedRandomTextPaster">
        
        <constructor-arg type="java.lang.Integer" index="0">
            <value>4value>
        constructor-arg>
        
        <constructor-arg type="java.lang.Integer" index="1">
            <value>4value>
        constructor-arg>
        
        <constructor-arg index="2">
            <ref bean="colorGen"/>
        constructor-arg>
        
        <constructor-arg index="3">
            <list>
                
            list>
        constructor-arg>
    bean>
    <bean id="baffleDecorator" class="com.octo.captcha.component.image.textpaster.textdecorator.BaffleTextDecorator">
        <constructor-arg type="java.lang.Integer" index="0"><value>1value>constructor-arg>
        <constructor-arg type="java.awt.Color" index="1"><ref bean="colorWrite"/>constructor-arg>
    bean>
    <bean id="colorGen" class="com.octo.captcha.component.image.color.SingleColorGenerator">
        <constructor-arg type="java.awt.Color" index="0">
            <ref bean="colorBlack"/>
        constructor-arg>
    bean>
    <bean id="colorWrite" class="java.awt.Color">
        <constructor-arg type="int" index="0">
            <value>255value>
        constructor-arg>
        <constructor-arg type="int" index="1">
            <value>255value>
        constructor-arg>
        <constructor-arg type="int" index="2">
            <value>255value>
        constructor-arg>
    bean>
    <bean id="colorBlack" class="java.awt.Color">
        <constructor-arg type="int" index="0">
            <value>50value>
        constructor-arg>
        <constructor-arg type="int" index="1">
            <value>50value>
        constructor-arg>
        <constructor-arg type="int" index="2">
            <value>50value>
        constructor-arg>
    bean>
beans>
web.xml 代码
因为是在 resources/spring 下新建 spring-jcaptcha.xml ， 所以 web.xml 无需重新配置。

<web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xmlns="http://java.sun.com/xml/ns/javaee"
         xsi:schemaLocation="http://java.sun.com/xml/ns/javaee
         http://java.sun.com/xml/ns/javaee/web-app_3_0.xsd"
         id="WebApp_ID" version="3.0">
  <display-name>springdisplay-name>

  <servlet>
    <servlet-name>springservlet-name>
    <servlet-class>org.springframework.web.servlet.DispatcherServletservlet-class>
    <init-param>
      <param-name>contextConfigLocationparam-name>
      <param-value>
        classpath:spring/spring-*.xml
      param-value>
    init-param>
  servlet>

  <servlet-mapping>
    <servlet-name>springservlet-name>
    <url-pattern>/url-pattern>
  servlet-mapping>

  <welcome-file-list>
    <welcome-file>index.jspwelcome-file>
  welcome-file-list>
web-app>
JcaptchaImageCreater.java
在 controller 下新建 JcaptchaImageCreater.java，用来生成验证码图片。
import java.awt.image.BufferedImage;
import java.io.ByteArrayOutputStream;
import java.io.IOException;

import javax.imageio.ImageIO;
import javax.servlet.ServletOutputStream;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.RequestMapping;

import com.octo.captcha.service.image.ImageCaptchaService;

@Controller
@RequestMapping("/captcha")
public class JcaptchaImageCreater {

    private Logger logger = LoggerFactory.getLogger(getClass());

    @Autowired
    private ImageCaptchaService imageCaptchaService;

    @RequestMapping
    public void handleRequest(HttpServletRequest request, HttpServletResponse response) {
        try {
            ByteArrayOutputStream jpegOutputStream = new ByteArrayOutputStream();
            String captchaId = request.getSession().getId();
            BufferedImage challenge = imageCaptchaService.getImageChallengeForID(captchaId, request.getLocale());

            response.setHeader("Cache-Control", "no-store");
            response.setHeader("Pragma", "no-cache");
            response.setDateHeader("Expires", 0L);
            response.setContentType("image/jpeg");

            ImageIO.write(challenge, "jpeg", jpegOutputStream);
            byte[] captchaChallengeAsJpeg = jpegOutputStream.toByteArray();

            ServletOutputStream respOs = response.getOutputStream();
            respOs.write(captchaChallengeAsJpeg);
            respOs.flush();
            respOs.close();
        } catch (IOException e) {
            logger.error("generate captcha image error: {}", e.getMessage());
        }
    }

}
CustomGenericManageableCaptchaService.java 重写 GenericManageableCaptchaService.java
在 service 下新建 CustomGenericManageableCaptchaService.java，将 removeCaptcha 方法提出来，便可以使用 AJAX 进行验证。
import com.octo.captcha.engine.CaptchaEngine;
import com.octo.captcha.service.CaptchaServiceException;
import com.octo.captcha.service.multitype.GenericManageableCaptchaService;

/**
 * @Description: TODO
 * @author Somnus
 * @date 2015年11月24日 下午1:21:50
 * @version V1.0
 */
public class CustomGenericManageableCaptchaService extends GenericManageableCaptchaService{

    /**
     * @param captchaEngine
     * @param minGuarantedStorageDelayInSeconds
     * @param maxCaptchaStoreSize
     */
    public CustomGenericManageableCaptchaService(CaptchaEngine captchaEngine, int minGuarantedStorageDelayInSeconds,
                                                 int maxCaptchaStoreSize) {
        super(captchaEngine, minGuarantedStorageDelayInSeconds, maxCaptchaStoreSize);
        // TODO Auto-generated constructor stub
    }
    /**
     * 修改验证码校验逻辑，默认的是执行了该方法后，就把sessionid从store当中移除

     * 然而在ajax校验的时候，如果第一次验证失败，第二次还得重新刷新验证码，这种逻辑不合理

     * 现在修改逻辑，只有校验通过以后，才移除sessionid。 Method Name：validateResponseForID .
     *
     * @param ID
     * @param response
     * @return
     * @throws CaptchaServiceException
     *             the return type：Boolean
     */
    @Override
    public Boolean validateResponseForID(String ID, Object response)
            throws CaptchaServiceException {
        if (!this.store.hasCaptcha(ID)) {
            throw new CaptchaServiceException(
                    "Invalid ID, could not validate unexisting or already validated captcha");
        }
        Boolean valid = this.store.getCaptcha(ID).validateResponse(response);
        //源码的这一句是没被注释的，这里我们注释掉，在下面暴露一个方法给我们自己来移除sessionId
        //this.store.removeCaptcha(ID);
        return valid;
    }

    /**
     * 移除session绑定的验证码信息.
     * Method Name：removeCaptcha .
     * @param sessionId
     * the return type：void
     */
    public void removeCaptcha(String sessionId){
        if(sessionId!=null && this.store.hasCaptcha(sessionId)){
            this.store.removeCaptcha(sessionId);
        }
    }
}
LoginController
在 controller 下新建 LoginController，进行用户注册和检查验证码的方法。
import javax.servlet.http.HttpServletRequest;

import com.octo.captcha.service.image.ImageCaptchaService;
import com.xunge.springemp.service.impl.CustomGenericManageableCaptchaService;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Controller;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.ResponseBody;
import org.springframework.web.bind.annotation.SessionAttributes;
import org.springframework.web.servlet.ModelAndView;

import com.xunge.springemp.dao.UserDAO;
import com.xunge.springemp.pojo.User;
import com.xunge.springemp.service.IUserService;

@Controller
@SessionAttributes("username")
public class LoginController {

    @Autowired
    private IUserService userService;

    @Autowired
    private ImageCaptchaService imageCaptchaService;

    @Autowired
    private CustomGenericManageableCaptchaService customGenericManageableCaptchaService;

    @Autowired
    private UserDAO userDAO;

    @RequestMapping("userAdd")
    public ModelAndView doAdd(User user, String captcha, HttpServletRequest request) throws Exception {

        Boolean isResponseCorrect = imageCaptchaService.validateResponseForID(request.getSession().getId(), captcha);
        if (isResponseCorrect) {
            userDAO.addUser(user);
            customGenericManageableCaptchaService.removeCaptcha(request.getSession().getId());
            ModelAndView mv = new ModelAndView("personal");
            return mv;
        } else {
            ModelAndView mv = new ModelAndView("register");
            return mv;
        }
    }

    @RequestMapping("/checkCaptcha")
    public @ResponseBody int checkCaptcha(String captcha, HttpServletRequest request) throws Exception {
        Boolean isResponseCorrect = imageCaptchaService.validateResponseForID(request.getSession().getId(), captcha);

        if (isResponseCorrect == false) {
            return 0;
        } else {
            return 1;
        }
    }
}
前端代码
<input type="text" class="form-control input-lg input_size input-captcha" id="captcha" name="captcha" maxlength="4" placeholder="请输入验证码" />
<img class="img-captcha" src="captcha" onclick="this.src='captcha?d='+new Date().getTime()" />
JS 代码
前端 AJAX 验证使用 JQuery 的 validate，进行表单的验证更美观。
$("#regform").validate({
    rules: {
        captcha: {
            required: true,
            remote: {
                url:"checkCaptcha.do",
                type:"get",
                contentType: "application/json;charset=utf-8",
                data:{
                    captcha:function(){return $("#captcha").val();}
                },
                dataFilter: function(data, type) {
                    if (data == 0)
                        return false;
                    else
                        return true;
                }
            }
        }
    },
    messages: {
        captcha: {
            required: "请输入验证码",
            remote: "验证码错误"
        }
    },
});
总结
更详细信息可以参考源码。


i7-7700k 装机实录
2017-06-08T01:01:42.000Z
最近感觉家里的 iMac 配置有些低，于是准备自己组装一台电脑。本文主要介绍一下自己的选购配件的过程以及装机时候的注意事项。
选购
在购买前已经做了一年多的功课啦，本来上次双十一就准备买来着，不过因为某种原因没有买成。今天再看当时的配件不是换代就是降价很多，不禁感叹摩尔定律依旧成立。。
买之前一直参照知乎大神的 @毅种循环 的专栏6.18，参考价值非常大，再次感谢毅神。
6.1 福利最大，幸好我当天锁了两单，还是非常优惠的。
下面给出我的配置单
配件 品牌 价格
CPU i7-7700k(散) 2078￥
显卡 索泰 GTX1060 6G 1899￥(-200)
主板 微星 Z270 gaming pro carbon 1375￥(-224)
内存条 英睿达 DDR4 2400 8G 主板赠(-339)
固态硬盘 三星 PM961 256G 629￥
机械硬盘 希捷酷鱼 7200转 2T 329￥(-80)
散热器 九州风神 大霜塔 179￥(-40)
电源 海韵 G-550 419￥(-80)
机箱 先马黑洞 289￥(-10)
显示器 戴尔 U2417h 1474(-175)
总计：8671￥(-1208)
其中除了 CPU 和 固态是从淘宝买的之外，其余全部走的京东，可以说福利还是足够的。
CPU 选购
因为 AMD 最近崛起的 Ryzen 处理器表现也相当不俗，也曾经考虑不过是否上 AMD。不过还是感觉英特尔稳妥一点，在游戏体验上英特尔也是略胜一筹，最终决定还是英特尔吧。
固态硬盘选购
M.2 接口的固态硬盘还是非常有必要的，读写速度也比 SATA 接口快了好几倍。
下面列取市场上主流 nvme 协议的固态硬盘，容量为 256G。大家可以根据自己的钱包进行选择。
品牌 价钱 颗粒 读/写(MB/S) 
英特尔 600p 660￥ TLC 1570/540 
建兴 T10 680￥ MLC 2700/1300 
三星960 evo 900￥ TLC 3200/1800 
SM 961 850￥ MLC 3200/1400 
PM 961 680￥ TLC 2800/1100 
注：MLC 好于 TLC，价格来源于 6月12日 淘宝。
装机
京东买的东西就是快，下完单最晚第二天就到了。然而 CPU 和 固态 走的淘宝，第二周才送到。
装机前看了几个装机视频，感觉还不错，推荐给大家 。
装机视频教程本文并没有介绍如何走背线，这篇视频介绍背线走法还是很详细的。
手把手带你从零开始台式电脑的组装同样是先马黑洞的机箱。
PcPartPicker装机教程外国大神装机教程
并且要仔细看主板的说明书！！！（x3）
装机的时候要注意避免静电。因为静电很容易损坏 CPU 或 主板，可以用手经常摸一下机箱，有条件的可以戴白色手套，戴防静电手环当然更好啦。
1. 装 CPU
这一步算是最容易的啦。将压杆侧压掀起保护盖，将 CPU 放入。注意 Intel 的 CPU 有两个小凹槽的防呆设计，与卡槽对齐后即可将压杆归位，同时保护盖跳起。
2. 装内存条
内存条的安装按道理也很简单，但是还是花了不少功夫。
内存条也有个凹槽，两边距离不同，按的时候对比一下凹槽对应即可，不容易安错。
不过在按内存条的时候真的是需要很大力气的。这里建议在主板底下垫一个软垫，可以更好地发力。
3. 安装 M.2 固态硬盘
我买的 Z270 主板有两个 M.2 插槽，其中有一个带有散热装甲，对固态硬盘的加速还是很有帮助的。
先将中间的平齐螺丝放在外侧，再将固态硬盘装好并用固定螺丝固定即可。
4. 装 CPU 散热
散热的安装相对复杂一些。因为买的 CPU 想超频，低端水冷还不如高端风冷，所以买了大霜塔。
说明书讲的还是很清楚的，这里简单说一下注意事项。
1.将四个固定钉插入中间孔，并套上保护胶套进行固定。（不要加矩形胶垫）
2.将 4 个固定钉从主板底下穿出。
3.套上四个胶垫。
4.固定支架，注意螺丝少量多次拧紧，对向螺丝一起拧。
5.将中间的风扇去掉，记住风扇是怎么摘的，一会还要装回去。
6.涂硅脂。往 CPU 上挤出黄豆粒大小的硅脂，用牙签涂匀。注意只需要薄薄一层，太厚了反倒不适合散热。
7.固定散热器本体。注意风扇方向是朝着内存吹的。如果挡内存可以把风扇往上移一些，或者把外侧的风扇放到相反一侧。拧螺丝时一定不要太用力，否则会压坏 CPU 或 主板。
8.将中间的风扇装好。
9.接风扇电源线。中间的风扇(4pin)接到 CPU_FAN1 接口上，旁边的风扇(3pin)接到任意 SYS_FAN 接口即可。(3pin插到4pin接口就行)
5. 装电源
我买的是 海韵 G-550 模组电源。首先把电源后面的模组都插好，再把电源用螺丝拧紧在机箱后面底部，注意风扇向下。
6. 装 机械硬盘/固态硬盘/光驱（SATA 接口）
每个机箱都不同，照着机箱说明书装就好啦。SATA 接口需要连接两根线：一根数据线，和主板相连；一根电源线，和电源相连。
7. 固定主板 IO 挡板
将主板的 IO 挡板固定在机箱上。
8. 固定主板到机箱
机箱在买回来的时候就有六个铜柱，在如图位置。因为我的主板是大板，所以需要把外面三个红圈的铜柱也拧上，并拧掉绿圈的铜柱（很紧，可能需要扳子）。
注意没用的铜柱一定要拧下来，否则可能导致主板短路。
固定螺丝如图所示。
这里说明一下，如果你用的也是大霜塔等大型散热器，最好提前插上 CPU 供电线，再固定主板。
因为我买的 CPU 散热器大霜塔太大，我又从背板走的线，CPU 的供电线非常难插，只有很小的空间，像我的大手根本进不去，最后没办法求助母上大人。母上大人的纤纤玉手也是勉强才伸进去。为了插这根线花了大约半个小时的时间。所以建议在固定主板前先把 CPU 的供电线插上，再固定主板，会轻松很多。
9. 连接各种跳线
推荐个百度经验
这一步是对新手来说最不友好的一步。需要往主板上插各种跳线。有电源线，机箱前置面板线，硬盘、风扇线等。
下图为主板用到的几个接口。
接口 名称 功能
① AUD1 耳机与麦克风接口
② JFP1 机箱开机键、指示灯等接口
③ JUSB1 机箱前面板USB
④ SATA 接硬盘、光驱
⑤ JUSB3 机箱前面板USB
⑥ ATX_PWR1 主板供电线
⑦ SYS_FAN4 CPU散热副风扇供电线
⑧ CPU_FAN1 CPU散热主风扇供电线
⑨ CPU_PWR1 CPU供电线
其中 ② JFP1 接口需要连接多根跳线，下图为具体连接方式。
10. 安装显卡
因为显卡比较大，容易挡住跳线接口，我们选择最后安装它。
需要卸下机箱的两个挡板，将显卡插入 PCIE 接口后用卸下的螺丝固定。
我买的是索泰至尊需要 6+8 pin 供电。模组电源有两个 8 pin 的显卡供电线，需要都连上，其中有一个 8 pin 线只连接 6 pin 接口。
总结
至此，装机已经完成，我们需要连接电源，连接显示器（用显卡的接口连，不是主板），开机看看是否点亮。
如果没有点亮也不用着急，我第一次也没有点亮，原因是机箱开关机键没有插好（可能是电源灯正负极接反了）。把 ② JFP1 接口的跳线拔下来重新插上再试试吧。
装系统速度神快，坦克世界终于开了最高特效！！那效果，爽！！
p.s. 幸亏 6.1 就全买完了。。显卡由于被挖矿的高价买走了，显卡至少贵500。。


Java 常见面试题及答案
2017-05-04T01:01:42.000Z
1.什么是Java虚拟机？为什么Java被称作是“平台无关的编程语言”？
Java 虚拟机是一个可以执行 Java 字节码的虚拟机进程。Java 源文件被编译成能被 Java 虚拟机执行的字节码文件。
Java 被设计成允许应用程序可以运行在任意的平台，而不需要程序员为每一个平台单独重写或者是重新编译。
Java 虚拟机让这个变为可能，因为它知道底层硬件平台的指令长度和其他特性。
2.JDK和JRE的区别是什么？
JDK: Java开发工具包,包含了JRE、编译器和其它工具（如：JavaDOc、Java调试器)
JRE: Java运行环境,包含Java虚拟机和Java程序所需的核心类库。
如果只是想跑Java程序，那么只需安装JRE，如果要写Java程序并且运行，那就需要JDK了。
3."static"关键字是什么意思？Java中是否可以覆盖一个private或者是static的方法？
如果一个类的变量或者方法前面有static修饰，那么表明这个方法或者变量属于这个类，也就是说可以在不创建对象的情况下直接使用
当父类的方法被private修饰时，表明该方法为父类私有，对其他任何类都是不可见的，因此如果子类定了一个与父类一样的方法，这对于子类来说相当于是一个新的私有方法，且如果要进行向上转型，然后去调用该“覆盖方法”，会产生编译错误。
class Parent {
    private fun() {
        ...
    }    
}
class Child extends Parent {
    private fun() {
        ...
    }
}
class Test {
    public static void main(String[] args) {
        Parent c = new Child();
        c.fun(); //编译出错
    }
}
static方法时编译时静态绑定的，属于类，而覆盖是运行时动态绑定的(动态绑定的多态),因此不能覆盖。
4.Java支持的基本数据类型有哪些？什么是自动拆装箱？
Java支持的基本数据类型有以下9种: byte, shot, int, long, float, double, char, boolean, void 。
自动拆装箱是Java从jdk1.5引用，目的是将原始类型自动的转换为相对应的对象，也可以逆向进行，即拆箱。这也体现Java中一切皆对象的宗旨。
所谓自动装箱就是将原始类型自动的转换为对应的对象，而拆箱就是将对象类型转换为基本类型。Java中的自动拆装箱通常发生在变量赋值的过程中，如：
Integer object = 3; //自动装箱
int o = object; //拆箱
在 Java 中，应该注意自动拆装箱，因为有时可能因为 Java 自动装箱机制，而导致创建了许多对象，对于内存小的平台会造成压力。
5. 覆盖和重载是什么?
覆盖 也叫 重写 ，发生在子类与父类之间，表示子类中的方法可以与父类中的某个方法的名称和参数完全相同，通过子类创建的实例对象调用这个方法时，将调用子类中的定义方法，这相当于把父类中定义的那个完全相同的方法给覆盖了，这也是面向对象编程的多态性的一种表现。
重载 是指在一个类中，可以有多个相同名称的方法，但是他们的参数列表的个数或类型不同，当调用该方法时，根据传递的参数类型调用对应参数列表的方法。注意！！ 当参数列表相同但返回值不同时，将会出现编译错误，这并不是重载，因为jvm无法根据返回值类型来判断应该调用哪个方法。
6.Java支持多继承么？如果不支持，如何实现?
在 Java 中是单继承的，也就是说一个类只能继承一个父类。
Java 中实现多继承有两种方式,一是接口，二是内部类。
//实现多个接口 如果两个接口的变量相同 那么在调用该变量的时候 编译出错
interface interface1 {
    static String field = "dd"; 
    public void fun1();
}
interface interface2 {
    static String field = "dddd";
    public void fun2();
}
class child implements interface1, interface2 {
    static String field = "dddd";
    @Override
    public void fun2() {
    }

    @Override
    public void fun1() {
    }    
}

//内部类 间接多继承
class Child {
    class Father {
        private void strong() {
            System.out.println("父类");
        }
    }
    class Mother {
        public void getCute() {
            System.out.println("母亲");
        }
    }
    public void getStrong() {
        Father f = new Father();
        f.strong();
    }
    public void getCute() {
        Mother m = new Mother();
        m.getCute();
    }
}
7.什么是值传递和引用传递？java中是值传递还是引用传递，还是都有?
值传递 就是在方法调用的时候，实参是将自己的一份拷贝赋给形参，在方法内，对该参数值的修改不影响原来实参，常见的例子就是刚开始学习c语言的时候那个交换方法的例子了。
引用传递 是在方法调用的时候，实参将自己的地址传递给形参，此时方法内对该参数值的改变，就是对该实参的实际操作。
在java中只有一种传递方式，那就是值传递.可能比较让人迷惑的就是java中的对象传递时，对形参的改变依然会影响到该对象的内容。
下面这个例子来说明Java中是值传递.
public class Test {
    public static void main(String[] args) {
        StringBuffer sb = new StringBuffer("hello ");
        getString(sb);
        System.out.println(sb);
    }
    public static void getString(StringBuffer s) {
        //s = new StringBuffer("ha");
        s.append("world");
    }
}
在上面这个例子中,当前输出结果为:hello world。这并没有什么问题，可能就是大家平常所理解的引用传递，那么当然会改变StringBuffer的内容。
但是如果把上面的注释去掉，那么就会输出:hello。此时sb的值并没有变成 ha hello。假如说是引用传递的话，那么形参的 s 也就是 sb 的地址，此时在方法里 new StringBuffer() ，并将该对象赋给 s ，也就是说 s 现在指向了这个新创建的对象.按照引用传递的说法，此时对 s 的改变就是对 sb 的操作，也就是说 sb 应该也指向新创建的对象，那么输出的结果应该为 ha world。但实际上输出的仅是 hello。这说明sb指向的还是原来的对象，而形参 s 指向的才是创建的对象,这也就验证了 Java 中的对象传递也是值传递。
8.接口和抽象类的区别是什么?
不同点在于：
接口中所有的方法隐含的都是抽象的。而抽象类则可以同时包含抽象和非抽象的方法。
类可以实现很多个接口，但是只能继承一个抽象类
类如果要实现一个接口，它必须要实现接口声明的所有方法。但是，类可以不实现抽象类声明的所有方法，当然，在这种情况下，类也必须得声明成是抽象的。
抽象类可以在不提供接口方法实现的情况下实现接口。
Java 接口中声明的变量默认都是 final 的。抽象类可以包含非 final 的变量。
Java 接口中的成员函数默认是 public 的。抽象类的成员函数可以是 private，protected 或者是 public 。
接口是绝对抽象的，不可以被实例化(java 8已支持在接口中实现默认的方法)
抽象类也不可以被实例化，但是，如果它包含 main 方法的话是可以被调用的。
9.构造器（constructor）是否可被重写（override）?
构造方法是不能被子类重写的，但是构造方法可以重载，也就是说一个类可以有多个构造方法。
10.Math.round(11.5) 等于多少? Math.round(-11.5)等于多少?
Math.round(11.5)==12 Math.round(-11.5)==-11
round 方法返回与参数 最接近的长整数，参数加 1/2 后求其 floor.
11. String, StringBuffer StringBuilder的区别。
String 的长度是不可变的；
StringBuffer的长度是可变的，如果你对字符串中的内容经常进行操作，特别是内容要修改时，那么使用 StringBuffer，如果最后需要 String，那么使用 StringBuffer 的 toString() 方法；线程安全；
StringBuilder 是从 JDK 5 开始，为StringBuffer该类补充了一个单个线程使用的等价类；通常应该优先使用 StringBuilder 类，因>为它支持所有相同的操作，但由于它不执行同步，所以速度更快。 使用字符串的时候要特别小心，如果对一个字符串要经常改变的话，就一定不要用String,否则会创建许多无用的对象出来. 来看一下比较
String s = "hello"+"world"+"i love you";
StringBuffer Sb = new StringBuilder("hello").append("world").append("i love you");
这个时候s有多个字符串进行拼接，按理来说会有多个对象产生，但是jvm会对此进行一个优化，也就是说只创建了一个对象，此时它的执行速度要比 StringBuffer 拼接快。再看下面这个:
String s2 = "hello";  
String s3 = "world";  
String s4 = "i love you";  
String s1 = s2 + s3 + s4;
上面这种情况，就会多创建出来三个对象，造成了内存空间的浪费。
12.JVM内存分哪几个区，每个区的作用是什么?
java虚拟机主要分为以下五个区:
(1) 方法区
有时候也成为永久代，在该区内很少发生垃圾回收，但是并不代表不发生GC，在这里进行的GC主要是对方法区里的常量池和对类型的卸载
方法区主要用来存储已被虚拟机加载的类的信息、常量、静态变量和即时编译器编译后的代码等数据。
该区域是被线程共享的。
方法区里有一个运行时常量池，用于存放静态编译产生的字面量和符号引用。该常量池具有动态性，也就是说常量并不一定是编译时确定，运行时生成的常量也会存在这个常量池中。
(2) 虚拟机栈
虚拟机栈也就是我们平常所称的栈内存,它为java方法服务，每个方法在执行的时候都会创建一个栈帧，用于存储局部变量表、操作数栈、动态链接和方法出口等信息。
虚拟机栈是线程私有的，它的生命周期与线程相同。
局部变量表里存储的是基本数据类型、returnAddress类型（指向一条字节码指令的地址）和对象引用，这个对象引用有可能是指向对象起始地址的一个指针，也有可能是代表对象的句柄或者与对象相关联的位置。局部变量所需的内存空间在编译器间确定
操作数栈的作用主要用来存储运算结果以及运算的操作数，它不同于局部变量表通过索引来访问，而是压栈和出栈的方式
每个栈帧都包含一个指向运行时常量池中该栈帧所属方法的引用，持有这个引用是为了支持方法调用过程中的动态连接.动态链接就是将常量池中的符号引用在运行期转化为直接引用。
(3) 本地方法栈
本地方法栈和虚拟机栈类似，只不过本地方法栈为Native方法服务。
(4) 堆
java堆是所有线程所共享的一块内存，在虚拟机启动时创建，几乎所有的对象实例都在这里创建，因此该区域经常发生垃圾回收操作。
(5) 程序计数器
内存空间小，字节码解释器工作时通过改变这个计数值可以选取下一条需要执行的字节码指令，分支、循环、跳转、异常处理和线程恢复等功能都需要依赖这个计数器完成。该内存区域是唯一一个java虚拟机规范没有规定任何OOM情况的区域。
如和判断一个对象是否存活?(或者GC对象的判定方法)
判断一个对象是否存活有两种方法:
(1) 引用计数法
所谓引用计数法就是给每一个对象设置一个引用计数器，每当有一个地方引用这个对象时，就将计数器加一，引用失效时，计数器就减一。当一个对象的引用计数器为零时，说明此对象没有被引用，也就是“死对象”,将会被垃圾回收。
引用计数法有一个缺陷就是无法解决循环引用问题，也就是说当对象A引用对象B，对象B又引用者对象A，那么此时A,B对象的引用计数器都不为零，也就造成无法完成垃圾回收，所以主流的虚拟机都没有采用这种算法。
(2) 可达性算法(引用链法)
该算法的思想是：从一个被称为 GC Roots 的对象开始向下搜索，如果一个对象到 GC Roots 没有任何引用链相连时，则说明此对象不可用。
在java中可以作为 GC Roots 的对象有以下几种:
虚拟机栈中引用的对象
方法区类静态属性引用的对象
方法区常量池引用的对象
本地方法栈JNI引用的对象
当一个对象不可达 GC Root 时，这个对象并不会立马被回收，而是出于一个死缓的阶段，若要被真正的回收需要经历两次标记。
如果对象在可达性分析中没有与 GC Root 的引用链，那么此时就会被第一次标记并且进行一次筛选，筛选的条件是是否有必要执行 finalize() 方法。当对象没有覆盖 finalize() 方法或者已被虚拟机调用过，那么就认为是没必要的。
如果该对象有必要执行 finalize() 方法，那么这个对象将会放在一个称为 F-Queue 的对队列中，虚拟机会触发一个 Finalize() 线程去执行，此线程是低优先级的，并且虚拟机不会承诺一直等待它运行完，这是因为如果 finalize() 执行缓慢或者发生了死锁，那么就会造成 F-Queue 队列一直等待，造成了内存回收系统的崩溃。 GC 对处于 F-Queue 中的对象进行第二次被标记，这时，该对象将被移除"即将回收"集合，等待回收。
15.java中垃圾收集的方法有哪些?
(1) 标记-清除:
这是垃圾收集算法中最基础的，根据名字就可以知道，它的思想就是标记哪些要被回收的对象，然后统一回收。这种方法很简单，但是会有两个主要问题：
效率不高，标记和清除的效率都很低；
会产生大量不连续的内存碎片，导致以后程序在分配较大的对象时，由于没有充足的连续内存而提前触发一次GC动作。
(2) 复制算法:
为了解决效率问题，复制算法将可用内存按容量划分为相等的两部分，然后每次只使用其中的一块，当一块内存用完时，就将还存活的对象复制到第二块内存上，然后一次性清楚完第一块内存，再将第二块上的对象复制到第一块。但是这种方式，内存的代价太高，每次基本上都要浪费一半的内存。
于是将该算法进行了改进，内存区域不再是按照 1：1 去划分，而是将内存划分为 8:1:1 三部分，较大那份内存交 Eden 区，其余是两块较小的内存区叫 Survior 区。每次都会优先使用 Eden 区，若 Eden 区满，就将对象复制到第二块内存区上，然后清除Eden区，如果此时存活的对象太多，以至于 Survivor 不够时，会将这些对象通过分配担保机制复制到老年代中。(java堆又分为新生代和老年代)
(3) 标记-整理:
该算法主要是为了解决标记-清除，产生大量内存碎片的问题；当对象存活率较高时，也解决了复制算法的效率问题。它的不同之处就是在清除对象的时候现将可回收对象移动到一端，然后清除掉端边界以外的对象，这样就不会产生内存碎片了。
(4) 分代收集:
现在的虚拟机垃圾收集大多采用这种方式，它根据对象的生存周期，将堆分为新生代和老年代。在新生代中，由于对象生存期短，每次回收都会有大量对象死去，那么这时就采用复制算法。老年代里的对象存活率较高，没有额外的空间进行分配担保，所以可以使用 标记-整理 或者 标记-清除。
16.java内存模型
java内存模型 (JMM) 是线程间通信的控制机制。 JMM 定义了主内存和线程之间抽象关系。线程之间的共享变量存储在主内存（main memory）中，每个线程都有一个私有的本地内存（local memory），本地内存中存储了该线程以读/写共享变量的副本。本地内存是 JMM 的一个抽象概念，并不真实存在。它涵盖了缓存，写缓冲区，寄存器以及其他的硬件和编译器优化。 Java 内存模型的抽象示意图如下：
从上图来看，线程 A 与线程 B 之间如要通信的话，必须要经历下面2个步骤：
首先，线程 A 把本地内存 A 中更新过的共享变量刷新到主内存中去。
然后，线程 B 到主内存中去读取线程A之前已更新过的共享变量。
17.java类加载过程?
java类加载需要经历以下 7 个过程：
(1) 加载
加载时类加载的第一个过程，在这个阶段，将完成以下三件事情：
通过一个类的全限定名获取该类的二进制流。
将该二进制流中的静态存储结构转化为方法去运行时数据结构。
在内存中生成该类的 Class 对象，作为该类的数据访问入口。
(2) 验证
验证的目的是为了确保Class文件的字节流中的信息不回危害到虚拟机。在该阶段主要完成以下四钟验证:
文件格式验证: 验证字节流是否符合Class文件的规范，如主次版本号是否在当前虚拟机范围内，常量池中的常量是否有不被支持的类型。
元数据验证: 对字节码描述的信息进行语义分析，如这个类是否有父类，是否集成了不被继承的类等。
字节码验证: 是整个验证过程中最复杂的一个阶段，通过验证数据流和控制流的分析，确定程序语义是否正确，主要针对方法体的验证。如: 方法中的类型转换是否正确，跳转指令是否正确等。
符号引用验证: 这个动作在后面的解析过程中发生，主要是为了确保解析动作能正确执行。
(3) 准备
准备阶段是为类的静态变量分配内存并将其初始化为默认值，这些内存都将在方法区中进行分配。准备阶段不分配类中的实例变量的内存，实例变量将会在对象实例化时随着对象一起分配在Java堆中。
public static int value=123;//在准备阶段value初始值为0 。在初始化阶段才会变为123 。
(4) 解析
该阶段主要完成符号引用到直接引用的转换动作。解析动作并不一定在初始化动作完成之前，也有可能在初始化之后。
(5) 初始化
初始化时类加载的最后一步，前面的类加载过程，除了在加载阶段用户应用程序可以通过自定义类加载器参与之外，其余动作完全由虚拟机主导和控制。到了初始化阶段，才真正开始执行类中定义的Java程序代码。
18. 简述 Java 类加载机制?
虚拟机把描述类的数据从 Class 文件加载到内存，并对数据进行校验，解析和初始化，最终形成可以被虚拟机直接使用的 Java 类型。
19. 类加载器双亲委派模型机制？
当一个类收到了类加载请求时，不会自己先去加载这个类，而是将其委派给父类，由父类去加载，如果此时父类不能加载，反馈给子类，由子类去完成类的加载。
20.什么是类加载器，类加载器有哪些?
实现通过类的权限定名获取该类的二进制字节流的代码块叫做类加载器。
主要有一下四种类加载器:
启动类加载器(Bootstrap ClassLoader): 用来加载 Java 核心类库，无法被 Java 程序直接引用。
扩展类加载器(extensions class loader): 它用来加载 Java 的扩展库。Java 虚拟机的实现会提供一个扩展库目录。该类加载器在此目录里面查找并加载 Java 类。
系统类加载器(system class loader): 它根据 Java 应用的类路径 (CLASSPATH) 来加载 Java 类。一般来说，Java 应用的类都是由它来完成加载的。可以通过 ClassLoader.getSystemClassLoader() 来获取它。
用户自定义类加载器，通过继承 java.lang.ClassLoader 类的方式实现。
21.简述java内存分配与回收策率以及 Minor GC 和 Major GC
对象优先在堆的 Eden 区分配。
大对象直接进入老年代。
长期存活的对象将直接进入老年代。
当 Eden 区没有足够的空间进行分配时，虚拟机会执行一次 Minor GC。
Minor Gc 通常发生在新生代的 Eden 区，在这个区的对象生存期短，往往发生 Gc 的频率较高，回收速度比较快;
Full Gc/Major GC 发生在老年代，一般情况下，触发老年代GC的时候不会触发Minor GC,但是通过配置，可以在 Full GC 之前进行一次 Minor GC 这样可以加快老年代的回收速度。
22.HashMap的工作原理是什么?
HashMap 内部是通过一个数组实现的，只是这个数组比较特殊，数组里存储的元素是一个 Entry 实体 (jdk 8为Node) ，这个 Entry 实体主要包含 key 、 value 以及一个指向自身的 next 指针。HashMap 是基于 hashing 实现的，当我们进行 put 操作时，根据传递的 key 值得到它的 hashcode ，然后再用这个 hashcode 与数组的长度进行模运算，得到一个 int 值，就是 Entry 要存储在数组的位置（下标）；当通过 get 方法获取指定 key 的值时，会根据这个 key 算出它的 hash 值（数组下标），根据这个 hash 值获取数组下标对应的 Entry ，然后判断 Entry 里的 key ， hash 值或者通过 equals() 比较是否与要查找的相同，如果相同，返回 value ，否则的话，遍历该链表（有可能就只有一个 Entry ，此时直接返回 null ），直到找到为止，否则返回null。
HashMap 之所以在每个数组元素存储的是一个链表，是为了解决 hash 冲突问题，当两个对象的 hash 值相等时，那么一个位置肯定是放不下两个值的，于是 hashmap 采用链表来解决这种冲突， hash 值相等的两个元素会形成一个链表。
23.HashMap与HashTable的区别是什么?
HashTable 基于 Dictionary 类，而 HashMap 是基于 AbstractMap 。 Dictionary 是任何可将键映射到相应值的类的抽象父类，而 AbstractMap 是基于 Map 接口的实现，它以最大限度地减少实现此接口所需的工作。
HashMap的key 和 value 都允许为 null ，而 Hashtable 的 key 和 value 都不允许为 null 。 HashMap 遇到 key 为 null 的时候，调用 putForNullKey 方法进行处理，而对 value 没有处理； Hashtable 遇到null ，直接返回 NullPointerException。
Hashtable 是同步的，而 HashMap 是非同步的，但是我们也可以通过 Collections.synchronizedMap(hashMap) ,使其实现同步。
24.CorrentHashMap的工作原理?
jdk 1.6版: ConcurrenHashMap 可以说是 HashMap 的升级版， ConcurrentHashMap 是线程安全的，但是与 Hashtable 相比，实现线程安全的方式不同。 Hashtable 是通过对 hash 表结构进行锁定，是阻塞式的，当一个线程占有这个锁时，其他线程必须阻塞等待其释放锁。 ConcurrentHashMap 是采用分离锁的方式，它并没有对整个 hash 表进行锁定，而是局部锁定，也就是说当一个线程占有这个局部锁时，不影响其他线程对 hash 表其他地方的访问。
具体实现: ConcurrentHashMap 内部有一个 Segment 数组,该 Segment 对象可以充当锁。 Segment 对象内部有一个 HashEntry 数组，于是每个 Segment 可以守护若干个桶 (HashEntry) ,每个桶又有可能是一个 HashEntry 连接起来的链表，存储发生碰撞的元素。
每个 ConcurrentHashMap 在默认并发级下会创建包含 16 个 Segment 对象的数组，每个数组有若干个桶，当我们进行 put 方法时，通过 hash 方法对 key 进行计算，得到 hash 值，找到对应的 segment ，然后对该 segment 进行加锁，然后调用 segment 的 put 方法进行存储操作，此时其他线程就不能访问当前的 segment ，但可以访问其他的 segment 对象，不会发生阻塞等待。
jdk 1.8版: 在jdk 8中， ConcurrentHashMap 不再使用 Segment 分离锁，而是采用一种乐观锁CAS算法来实现同步问题，但其底层还是 “数组+链表->红黑树” 的实现。
25.遍历一个List有哪些不同的方式？
List strList = new ArrayList<>();
//for-each
for(String str:strList) {
    System.out.print(str);
}

//use iterator 尽量使用这种 更安全(fail-fast)
Iterator it = strList.iterator();
while(it.hasNext) {
    System.out.printf(it.next());
}
26.fail-fast与fail-safe有什么区别？
Iterator 的 fail-fast 属性与当前的集合共同起作用，因此它不会受到集合中任何改动的影响。 Java.util 包中的所有集合类都被设计为 fail->fast 的，而 java.util.concurrent 中的集合类都为 fail-safe 的。当检测到正在遍历的集合的结构被改变时， Fail-fast 迭代器抛出 ConcurrentModificationException ，而 fail-safe 迭代器从不抛出 ConcurrentModificationException。
27.Array和ArrayList有何区别？
Array可以容纳基本类型和对象，而ArrayList只能容纳对象。
Array是指定大小的，而ArrayList大小是固定的
28.哪些集合类提供对元素的随机访问？
ArrayList、HashMap、TreeMap和HashTable类提供对元素的随机访问。
29.HashSet 的底层实现是什么?
通过看源码知道 HashSet 的实现是依赖于 HashMap 的，HashSet 的值都是存储在 HashMap 中的。在 HashSet 的构造法中会初始化一个 HashMap 对象， HashSet 不允许值重复，因此， HashSet 的值是作为 HashMap 的 key 存储在 HashMap 中的，当存储的值已经存在时返回 false。
30.LinkedHashMap 的实现原理?
LinkedHashMap 也是基于 HashMap 实现的，不同的是它定义了一个 Entry header ，这个 header 不是放在 Table 里，它是额外独立出来的。 LinkedHashMap 通过继承 hashMap 中的 Entry ,并添加两个属性 Entry before , after ,和 header 结合起来组成一个双向链表，来实现按插入顺序或访问顺序排序。 LinkedHashMap 定义了排序模式 accessOrder ，该属性为 boolean 型变量，对于访问顺序，为 true ；对于插入顺序，则为 false 。一般情况下，不必指定排序模式，其迭代顺序即为默认为插入顺序。
31.LinkedList和ArrayList的区别是什么?
ArrayList是基于数组实现，LinkedList是基于链表实现
ArrayList在查找时速度快，LinkedList在插入与删除时更具优势
32.什么是线程？进程和线程的关系是什么？
线程可定义为进程内的一个执行单位，或者定义为进程内的一个可调度实体。 在具有多线程机制的操作系统中，处理机调度的基本单位不是进程而是线程。一个进程可以有多个线程，而且至少有一个可执行线程。
打个比喻:进程好比工厂(计算机)里的车间，一个工厂里有多个车间(进程)在运转,每个车间里有多个工人（线程）在协同工作，这些工人就可以理解为线程。
线程和进程的关系:
线程是进程的一个组成部分。
进程的多个线程都在进程地址空间活动。
系统资源是分配给进程的，线程需要资源时，系统从进程的资源里分配给线程。
处理机调度的基本单位是线程。
33.Thread 类中的 start() 和 run() 方法有什么区别？
start() 方法被用来启动新创建的线程，而且 start() 内部调用了 run() 方法，这和直接调用 run() 方法的效果不一样。当你调用 run() 方法的时候，只会是在原来的线程中调用，没有新的线程启动，start() 方法才会启动新线程。
34.什么是线程安全?
当多个线程访问某个类时，不管运行时环境采用何种调度方式或者线程将如何交替执行，并且在主调代码中不需要任何额外的同步或协同，这个类都能表现出正确的行为。
线程安全的核心是 “正确性” ，也就是说当多个线程访问某个类时，能够得到预期的结果，那么就是线程安全的。
35.Java中有哪几种锁?
自旋锁: 自旋锁在 JDK1.6 之后就默认开启了。基于之前的观察，共享数据的锁定状态只会持续很短的时间，为了这一小段时间而去挂起和恢复线程有点浪费，所以这里就做了一个处理，让后面请求锁的那个线程在稍等一会，但是不放弃处理器的执行时间，看看持有锁的线程能否快速释放。为了让线程等待，所以需要让线程执行一个忙循环也就是自旋操作。
在jdk6之后，引入了自适应的自旋锁，也就是等待的时间不再固定了，而是由上一次在同一个锁上的自旋时间及锁的拥有者状态来决定
偏向锁: 目的是消除数据在无竞争情况下的同步原语。进一步提升程序的运行性能。 偏向锁就是偏心的偏，意思是这个锁会偏向第一个获得他的线程，如果接下来的执行过程中，该锁没有被其他线程获取，则持有偏向锁的线程将永远不需要再进行同步。偏向锁可以提高带有同步但无竞争的程序性能，也就是说他并不一定总是对程序运行有利，如果程序中大多数的锁都是被多个不同的线程访问，那偏向模式就是多余的，在具体问题具体分析的前提下，可以考虑是否使用偏向锁。
轻量级锁: 为了减少获得锁和释放锁所带来的性能消耗，引入了“偏向锁”和“轻量级锁”，所以在 Java SE1.6 里锁一共有四种状态，无锁状态，偏向锁状态，轻量级锁状态和重量级锁状态，它会随着竞争情况逐渐升级。锁可以升级但不能降级，意味着偏向锁升级成轻量级锁后不能降级成偏向锁。这种锁升级却不能降级的策略，目的是为了提高获得锁和释放锁的效率。
36.synchronized内置锁
java中以synchronize的形式, 为防止资源冲突提供了内置支持。当任务要执行被 synchronize 关键字保护的代码段时, 它将检查锁是否可用, 然后获取锁--执行代码--释放锁。
所有对象都自动含有单一的锁。当一个线程正在访问一个对象的 synchronized 方法,那么其他线程不能访问该对象的其他 synchronized 方法,但可以访问非 synchronized 方法。因为一个对象只有一把锁,当一个线程获取了该对象的锁之后,其他线程无法获取该对象的锁,所以无法访问该对象的其他 synchronized 方法。
synchronized代码块
synchronized(synObject) {

}
当在某个线程中执行这段代码块，该线程会获取对象 synObject 的锁，从而使得其他线程无法同时访问该代码块。 synObject 可以是 this ,代表获取当前对象的锁,也可以是类中的一个属性,代表获取该属性的锁。
针对每一个类,也有一个锁,所以 static synchronize 方法可以在类的范围内防止对static数据的并发访问。如果一个线程执行一个对象的非 static synchronized 方法，另外一个线程需要执行这个对象所属类的 static synchronized方法，此时不会发生互斥现象，因为访问 static synchronized 方法占用的是类锁，而访问非 static synchronized方法占用的是对象锁，所以不存在互斥现象。
对于 synchronized 方法或者 synchronized 代码块，当出现异常时，JVM 会自动释放当前线程占用的锁，因此不会由于异常导致出现死锁现象。
37.ThreadLocal理解
ThreadLocal 是一个创建线程局部变量的类。通常情况下我们创建的变量,可以被多个线程访问并修改,通过 ThreadLocal 创建的变量只能被当前线程访问。
ThreadLocal 内部实现：
ThreadLocal 提供了 set 和 get 方法。
set 方法会先获取当前线程,然后用当前线程作为句柄,获取 ThreadLocaMap 对象,并判断该对象是否为空,如果为空则创建一个,并设置值,不为空则直接设置值。
 public void set(T value) {
    Thread t = Thread.currentThread();
    ThreadLocalMap map = getMap(t);
    if (map != null)
        map.set(this, value);
    else
        createMap(t, value);
}
ThreadLocal 的值是放入了当前线程的一个 ThreadLocalMap 实例中，所以只能在本线程中访问，其他线程无法访问。
ThreadLocal 并不会导致内存泄露,因为 ThreadLocalMap 中的 key 存储的是 ThreadLocal 实例的弱引用,因此如果应用使用了线程池,即便之前的线程实例处理完之后出于复用的目的依然存活,也不会产生内存泄露。
38.为什么wait, notify 和 notifyAll这些方法不在thread类里面?
这是个设计相关的问题，它考察的是面试者对现有系统和一些普遍存在但看起来不合理的事物的看法。回答这些问题的时候，你要说明为什么把这些方法放在Object类里是有意义的，还有不把它放在Thread类里的原因。
一个很明显的原因是JAVA提供的锁是对象级的而不是线程级的，每个对象都有锁，通过线程获得。如果线程需要等待某些锁那么调用对象中的 wait() 方法就有意义了。如果 wait() 方法定义在 Thread 类中，线程正在等待的是哪个锁就不明显了。简单的说，由于 wait ， notify 和 notifyAll 都是锁级别的操作，所以把他们定义在Object类中因为锁属于对象。


快速排序 C++
2017-05-03T01:01:42.000Z
快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高，因此经常被采用，再加上快速排序思想--分治法也确实实用，因此很多软件公司的笔试面试，包括像腾讯，微软等知名IT公司都喜欢考这个，还有大大小的程序方面的考试如软考，考研中也常常出现快速排序的身影。
快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略，通常称其为分治法
该方法的基本思想是：
先从数列中取出一个数作为基准数。
分区过程，将比这个数大的数全放到它的右边，小于或等于它的数全放到它的左边。
再对左右区间重复第二步，直到各区间只有一个数。
对挖坑填数进行总结
i =L; j = R; 将基准数挖出形成第一个坑a[i]。
j--由后向前找比它小的数，找到后挖出此数填前一个坑a[i]中。
i++由前向后找比它大的数，找到后也挖出此数填到前一个坑a[j]中。
再重复执行2，3二步，直到i==j，将基准数填入a[i]中。
照着这个总结很容易实现挖坑填数的代码：
//快速排序
void quick_sort(int s[], int l, int r)
{
    if (l < r)
    {
        //Swap(s[l], s[(l + r) / 2]); //将中间的这个数和第一个数交换 参见注1
        int i = l, j = r, x = s[l];
        while (i < j)
        {
            while(i < j && s[j] >= x) // 从右向左找第一个小于x的数
            {
                j--;  
            }
            if(i < j)
            {
                s[i++] = s[j];
            }

            while(i < j && s[i] < x) // 从左向右找第一个大于等于x的数
            {
                i++;  
            }
            if(i < j)
            {
                s[j--] = s[i];
            }
        }
        s[i] = x;
        quick_sort(s, l, i - 1); // 递归调用 
        quick_sort(s, i + 1, r);
    }
}
快速排序还有很多改进版本，如随机选择基准数，区间内数据较少时直接用另的方法排序以减小递归深度。有兴趣的筒子可以再深入的研究下。
参考资料http://blog.csdn.net/morewindows/article/details/6684558


正则表达式简介
2017-05-02T01:01:42.000Z
正则表达式是一种特殊的字符串模式，用于匹配一组字符串。本文将介绍正则表达式的简单规则。
正则表达式通用匹配符号
正则表达式 说明 正确示例 错误示例
. 匹配任何单个符号，包括所有字符 (“..”, “a%”) – true (“..”, “a”) – false
^xxx 在开头匹配正则xxx (“^a.c.”, “abcd”) – true (“^a”, “ac”) – false
xxx\\(|在结尾匹配正则xxx|(“..cd\\\)”, “abcd”) – true (“a\$”, “aca”) – false 
[abc] 能够匹配字母a,b或c (“¹d.”, “ad9”) – true (“[ab]x”, “cx”) – false
[^abc] 当^是[]中的第一个字符时代表取反 (“[^ab][^12].”, “c3#”) – true (“[^ab][^12]“, “c2″) – false
[a-e1-8] 匹配a到e或者1到8之间的字符 (“[a-e1-3].”, “d#”) – true (“[a-e1-3]“, “f2″) – false
xx\ yy 匹配正则xx或者yy (“x.\
正则表达式元字符
正则表达式 说明
任意数字，等同于[0-9] |任意非数字，等同于[^0-9] |任意空白字符，等同于[0B |任意非空白字符，等同于[^\s] |任意英文字符，等同于[a-zA-Z_0-9] |任意非英文字符，等同于[^\w] 单词边界 |非单词边界
有两种方法可以在正则表达式中像一般字符一样使用元字符。
在元字符前添加反斜杠()
将元字符置于(开始引用)和(结束引用)间
正则表达式量词
正则表达式 说明
x? x没有出现或者只出现一次
X* X出现0次或更多
X+ X出现1次或更多
X{n} X正好出现n次
X{n,} X出席n次或更多
X{n,m} X出现至少n次但不多于m次
原文链接： journaldev 翻译： ImportNew.com - ImportNew读者 译文链接： http://www.importnew.com/6810.html [ 转载请保留原文出处、译者和译文链接。]
abc↩︎


MI5 刷 MIUI 国际版
2017-04-09T01:01:42.000Z
MIUI 是基于 Android 开发的手机系统，非常适合国人使用。然而由于国内的某些原因， MIUI 并不支持 Google 全家桶，这对谷歌应用有强烈需求的小伙伴们来说是不能忍的。
MIUI 国际版很好的解决了这点不足。MIUI 国际版是自带 Google 全家桶的，不仅 MIUI 的功能大部分都有保留，而且还能享受完整的 Google 服务，岂不完美？
本文将介绍小米手机（米5）如何刷 MIUI 国际版，以及一些踩坑经历。
MIUI 国际版的优点和不足
MIUI 国际版优点自然不必多说，不仅可以享受完整的 Google 服务，而且所有被人诟病的 MIUI 系统广告全都消失，相当干净，这对广告过敏者是一个非常棒的选择。
当然，在使用了一周后，发现一些在 国行版 很方便的功能在 国际版 进行了阉割，如自动和运营商校准流量（仍能显示已使用流量），小米钱包（MiPay，公交卡）下方方法已解决，小米应用商店(底部有旧版apk) 等都因为国界问题消失了。如果您很依赖上述功能，那么在刷国际版之前一定要三思啊！！
当然你也可以通过在国行版中安装 Google框架服务 使用 Google套件，但是因为 Android 升级到了7.0 ，博主试了好多种方法都没有成功，无奈只好安装 MIUI 国际版啦...
刷机教程
MIUI 国际版官方其实是有官方教程的， 链接如下， 一共有三种方法，在这里因为安装包更新，recovery 系统更新等原因，前两种方法楼主都没有尝试成功，于是只好使用第三种 线刷法。
首先需要下载线刷包。因为线刷包和卡刷包不同，不太好找，博主找线刷包的链接找了好久，可算被我找到了~~ 链接如下， 该链接附带线刷法教程，这里简单翻译一下。
1.解除 BootLoader 锁
目前，小米全线手机已经加上了 BL 锁，必须解除 BL 锁才能刷机。想要解除 BL 锁可以参考 这个帖子，写的很详细。
2.下载 MiFlash 刷机工具。解压后点击 MiFlash.exe 安装。中间可能会出现提示条，始终点击继续安装就可以正常安装完毕。
3.下载线刷包，链接同 上方教程链接，下载对应手机版本的线刷包并解压。注意 不要 在官网的 Download 里下载。
4.关机。同时按住 音量- 和 电源键 ,进入 Fastboot 模式，界面是一个 正在修安卓机器人的米兔。
5.用数据线连结电脑，将解压后的路径复制到 MiFlash 的路径中，点击刷新，列表中会出现你的设备。注意一定要选中底下的 清除所有数据！！（都刷机了就别抱幻想保留用户数据了。。博主当时就选择的保留用户数据，结果卡在开机界面一个多小时，后来没办法进入 Recovery模式 清除所有数据，马上就开机了）然后点击刷机就成功了。
因为刷完机后只能使用 Google Play 商店，所以建议之前先准备好 VPN 或 Shadowsocks 等翻墙软件。
使用中的一些问题
Google Play 商店下载应用始终显示 正在等待连接WLAN
博主在使用 Google Play 商店时发现下载应用时出现 正在等待连接WLAN 提示。。然而我已经连上 WLAN 了。。
解决办法是 设置 -> 更多应用 -> Google Play 商店 -> 卸载更新。 之后再打开 Google Play 商店 就可以下载软件了。不过过几天下载就又提示 正在等待连接WLAN，还需要重复上述操作。这应该是系统 Bug，应该会解决的。
MIUI 国际版无法使用 小米钱包（MiPay，公交卡）
无需 Root 权限，只需要安装两个 apk 就可以啦。 下载链接
小米应用商店旧版下载
旧版小米应用商店 下载链接
不过由于是旧版，风格与 MIUI8 格格不入，所以推荐 酷安 应用商店，很全，不流氓。


计算机网络面试常考点--参照 谢希仁(第6版)
2017-04-01T01:01:42.000Z
本篇计算机网络面试常考点，参照《计算机网络（第6版） 谢希仁》教材，希望对大家有所帮助。
这是我总结的两个知识点，对于期末复习的小伙伴很有帮助。
知识点1
知识点2
下文主要写的是在笔试或面试中常问的知识点
OSI，TCP/IP，五层协议的体系结构，以及各层协议
OSI分层（7层）：物理层、数据链路层、网络层、传输层、会话层、表示层、应用层。
TCP/IP分层（4层）：网络接口层、网际层、运输层、应用层。
五层协议（5层）：物理层、数据链路层、网络层、运输层、应用层。
每一层的协议如下：
物理层：RJ45、CLOCK、IEEE802.3 （中继器，集线器，网关）
数据链路：PPP、FR、HDLC、VLAN、MAC （网桥，交换机）
网络层：IP、ICMP、ARP、RARP、OSPF、IPX、RIP、IGRP、 （路由器）
传输层：TCP、UDP、SPX
会话层：NFS、SQL、NETBIOS、RPC
表示层：JPEG、MPEG、ASII
应用层：FTP、DNS、Telnet、SMTP、HTTP、WWW、NFS
每一层的作用如下：
物理层：通过媒介传输比特,确定机械及电气规范（比特Bit）
数据链路层：将比特组装成帧和点到点的传递（帧Frame）
网络层：负责数据包从源到宿的传递和网际互连（包Packet）
传输层：提供端到端的可靠报文传递和错误恢复（段Segment）
会话层：建立、管理和终止会话（会话协议数据单元SPDU）
表示层：对数据进行翻译、加密和压缩（表示协议数据单元PPDU）
应用层：允许访问OSI环境的手段（应用协议数据单元APDU）
IP地址的分类
类别 最大网络数 IP地址范围 最大主机数
A 126（2^7-2) 0.0.0.0-127.255.255.255 16777214
B 16384(2^14) 128.0.0.0-191.255.255.255 65534
C 2097152(2^21) 192.0.0.0-223.255.255.255 254
A类地址：以0开头；
B类地址：以10开头；
C类地址：以110开头；
10.0.0.0~10.255.255.255， 172.16.0.0~172.31.255.255， 192.168.0.0~192.168.255.255。（Internet上保留地址用于内部）
IP地址与子网掩码相与得到主机号
ARP是地址解析协议，简单语言解释一下工作原理。
首先，每个主机都会在自己的ARP缓冲区中建立一个 ARP 列表，以表示 IP 地址和 MAC 地址之间的对应关系。
当源主机要发送数据时，首先检查 ARP 列表中是否有对应 IP 地址的目的主机的 MAC 地址，如果有，则直接发送数据，如果没有，就向本网段的所有主机发送 ARP 数据包，该数据包包括的内容有：源主机IP地址，源主机 MAC 地址，目的主机的 IP 地址。
当本网络的所有主机收到该 ARP 数据包时，首先检查数据包中的 IP 地址是否是自己的 IP 地址，如果不是，则忽略该数据包，如果是，则首先从数据包中取出源主机的 IP 和 MAC 地址写入到 ARP 列表中，如果已经存在，则覆盖，然后将自己的 MAC 地址写入 ARP 响应包中，告诉源主机自己是它想要找的 MAC 地址。
源主机收到ARP响应包后。将目的主机的 IP 和 MAC 地址写入 ARP 列表，并利用此信息发送数据。如果源主机一直没有收到 ARP 响应数据包，表示 ARP 查询失败。
广播发送 ARP 请求，单播发送 ARP 响应。
各种协议
ICMP协议： 因特网控制报文协议。它是 TCP/IP 协议族的一个子协议，用于在 IP 主机、路由器之间传递控制消息。
TFTP协议： 是 TCP/IP 协议族中的一个用来在客户机与服务器之间进行简单文件传输的协议，提供不复杂、开销不大的文件传输服务。
HTTP协议： 超文本传输协议，是一个属于应用层的面向对象的协议，由于其简捷、快速的方式，适用于分布式超媒体信息系统。
DHCP协议： 动态主机配置协议，是一种让系统得以连接到网络上，并获取所需要的配置参数手段。
NAT协议： 网络地址转换属接入广域网(WAN)技术，是一种将私有（保留）地址转化为合法IP地址的转换技术，
DHCP协议： 一个局域网的网络协议，使用 UDP 协议工作，用途：给内部网络或网络服务供应商自动分配 IP 地址，给用户或者内部网络管理员作为对所有计算机作中央管理的手段。
描述：RARP
RARP是逆地址解析协议，作用是完成硬件地址到IP地址的映射，主要用于无盘工作站，因为给无盘工作站配置的IP地址不能保存。
工作流程：在网络中配置一台RARP服务器，里面保存着 IP 地址和 MAC 地址的映射关系，当无盘工作站启动后，就封装一个 RARP 数据包，里面有其 MAC 地址，然后广播到网络上去，当服务器收到请求包后，就查找对应的 MAC 地址的 IP 地址装入响应报文中发回给请求者。
因为需要广播请求报文，因此 RARP 只能用于具有广播能力的网络。
TCP三次握手和四次挥手的全过程
三次握手：
第一次握手：客户端发送 syn 包 (syn=x) 到服务器，并进入 SYN_SEND 状态，等待服务器确认；
第二次握手：服务器收到 syn 包，必须确认客户的 SYN （ack=x+1） ，同时自己也发送一个 SYN 包 （syn=y） ，即 SYN+ACK 包，此时服务器进入 SYN_RECV 状态；
第三次握手：客户端收到服务器的 SYN＋ACK 包，向服务器发送确认包 ACK (ack=y+1) ，此包发送完毕，客户端和服务器进入 ESTABLISHED 状态，完成三次握手。
握手过程中传送的包里不包含数据，三次握手完毕后，客户端与服务器才正式开始传送数据。理想状态下，TCP连接一旦建立，在通信双方中的任何一方主动关闭连接之前，TCP 连接都将被一直保持下去。
四次握手
与建立连接的 三次握手 类似，断开一个 TCP 连接则需要 四次握手 。
第一次挥手：主动关闭方发送一个 FIN ，用来关闭主动方到被动关闭方的数据传送，也就是主动关闭方告诉被动关闭方：我已经不 会再给你发数据了(当然，在 fin 包之前发送出去的数据，如果没有收到对应的 ack 确认报文，主动关闭方依然会重发这些数据)，但是，此时主动关闭方还可以接受数据。
第二次挥手：被动关闭方收到 FIN 包后，发送一个 ACK 给对方，确认序号为收到序号 +1 （与 SYN 相同，一个 FIN 占用一个序号）。
第三次挥手：被动关闭方发送一个 FIN ，用来关闭被动关闭方到主动关闭方的数据传送，也就是告诉主动关闭方，我的数据也发送完了，不会再给你发数据了。
第四次挥手：主动关闭方收到 FIN 后，发送一个 ACK 给被动关闭方，确认序号为收到序号 +1，至此，完成四次挥手。
在浏览器中输入 www.baidu.com 后执行的全部过程
客户端浏览器通过 DNS 解析到 www.baidu.com 的IP地址 220.181.27.48 ，通过这个IP地址找到客户端到服务器的路径。客户端浏览器发起一个 HTTP 会话到 220.161.27.48 ，然后通过TCP进行封装数据包，输入到网络层。
在客户端的传输层，把 HTTP 会话请求分成报文段，添加源和目的端口，如服务器使用 80 端口监听客户端的请求，客户端由系统随机选择一个端口如 5000 ，与服务器进行交换，服务器把相应的请求返回给客户端的 5000 端口。然后使用IP层的IP地址查找目的端。
客户端的网络层不用关系应用层或者传输层的东西，主要做的是通过查找路由表确定如何到达服务器，期间可能经过多个路由器，这些都是由路由器来完成的工作，我不作过多的描述，无非就是通过查找路由表决定通过那个路径到达服务器。
客户端的链路层，包通过链路层发送到路由器，通过邻居协议查找给定 IP 地址的 MAC 地址，然后发送 ARP 请求查找目的地址，如果得到回应后就可以使用 ARP 的请求应答交换的IP数据包现在就可以传输了，然后发送 IP 数据包到达服务器的地址。
TCP和UDP的区别
-- TCP UDP
连接性 面向连接 无连接
可靠性 可靠 不可靠
报文 面向字节流 面向报文
应用场合 传输大量的数据 少量数据
速度 慢 快
流量控制 有 无
拥塞控制 有 无
TCP对应的协议和UDP对应的协议
TCP对应的协议：
（1） FTP：定义了文件传输协议，使用 21 端口。
（2） Telnet：一种用于远程登陆的端口，使用 23 端口，用户可以以自己的身份远程连接到计算机上，可提供基于 DOS 模式下的通信服务。
（3） SMTP：邮件传送协议，用于发送邮件。服务器开放的是 25 端口。
（4） POP3：它是和SMTP对应， POP3 用于接收邮件。POP3协议所用的是 110 端口。
（5）HTTP：是从Web服务器传输超文本到本地浏览器的传送协议，使用 80 端口。
UDP对应的协议：
（1） DNS：用于域名解析服务，将域名地址转换为IP地址。 DNS 用的是 53 端口。
（2） SNMP：简单网络管理协议，使用 161 端口，是用来管理网络设备的。由于网络设备很多，无连接的服务就体现出其优势。
（3） TFTP (Trival File Transfer Protocal)，简单文件传输协议，该协议在熟知端口 69 上使用UDP服务。
DNS域名系统，简单描述其工作原理。
当DNS客户机需要在程序中使用名称时，它会查询DNS服务器来解析该名称。客户机发送的每条查询信息包括三条信息，包括：指定的DNS域名，指定的查询类型，DNS域名的指定类别。基于 UDP 服务，端口 53 。 该应用一般不直接为用户使用，而是为其他应用服务，如 HTTP， SMTP 等在其中需要完成主机名到IP地址的转换。
面向连接和非面向连接的服务的特点是什么？
面向连接的服务，通信双方在进行通信之前，要先在双方建立起一个完整的可以彼此沟通的通道，在通信过程中，整个连接的情况一直可以被实时地监控和管理。
非面向连接的服务，不需要预先建立一个联络两个通信节点的连接，需要通信的时候，发送节点就可以往网络上发送信息，让信息自主地在网络上去传，一般在传输的过程中不再加以监控。
TCP的三次握手过程？为什么会采用三次握手，若采用二次握手可以吗？
答：建立连接的过程是利用客户服务器模式，假设主机A为客户端，主机B为服务器端。
（1）TCP的三次握手过程：主机 A 向 B 发送连接请求；主机 B 对收到的主机 A 的报文段进行确认；主机 A 再次对主机 B 的确认进行确认。
（2）采用三次握手是为了防止失效的连接请求报文段突然又传送到主机 B ，因而产生错误。 失效的连接请求报文段是指：主机 A 发出的连接请求没有收到主机 B 的确认，于是经过一段时间后，主机 A 又重新向主机 B 发送连接请求，且建立成功，顺序完成数据传输。考虑这样一种特殊情况，主机 A 第一次发送的连接请求并没有丢失，而是因为网络节点导致延迟达到主机 B ，主机B以为是主机 A 又发起的新连接，于是主机 B 同意连接，并向主机 A 发回确认，但是此时主机 A 根本不会理会，主机 B 就一直在等待主机 A 发送数据，导致主机 B 的资源浪费。
（3）采用两次握手不行，原因就是上面说的实效的连接请求的特殊情况。
端口及对应的服务
服务 端口号 服务 端口号
FTP 21 SSH 22
telnet 23 SMTP 25
Domain(域名服务器) 53 HTTP 80
POP3 110 NTP（网络时间协议） 123
MySQL数据库服务 3306 Shell或 cmd 514
POP-2 109 SQL Server 1433
了解交换机、路由器、网关的概念，并知道各自的用途
1）交换机
在计算机网络系统中，交换机是针对共享工作模式的弱点而推出的。交换机拥有一条高带宽的背部总线和内部交换矩阵。交换机的所有的端口都挂接在这条背 部总线上，当控制电路收到数据包以后，处理端口会查找内存中的地址对照表以确定目的 MAC （网卡的硬件地址）的 NIC （网卡）挂接在哪个端口上，通过内部 交换矩阵迅速将数据包传送到目的端口。目的 MAC 若不存在，交换机才广播到所有的端口，接收端口回应后交换机会“学习”新的地址，并把它添加入内部地址表中。
交换机工作于 OSI 参考模型的第二层，即数据链路层。交换机内部的CPU会在每个端口成功连接时，通过 ARP 协议学习它的 MAC 地址，保存成一张 ARP 表。在今后的通讯中，发往该 MAC 地址的数据包将仅送往其对应的端口，而不是所有的端口。因此，交换机可用于划分数据链路层广播，即冲突域；但它不能划分网络层广播，即广播域。
交换机被广泛应用于二层网络交换，俗称 二层交换机 。
交换机的种类有：二层交换机、三层交换机、四层交换机、七层交换机分别工作在OSI七层模型中的第二层、第三层、第四层盒第七层，并因此而得名。
2）路由器
路由器（Router）是一种计算机网络设备，提供了路由与转送两种重要机制，可以决定数据包从来源端到目的端所经过 的路由路径（host到host之间的传输路径），这个过程称为路由；将路由器输入端的数据包移送至适当的路由器输出端(在路由器内部进行)，这称为转 送。路由工作在OSI模型的第三层 即网络层，例如网际协议。
路由器的一个作用是连通不同的网络，另一个作用是选择信息传送的线路。 路由器与交换器的差别，路由器是属于OSI第三层的产品，交换器是OSI第二层的产品(这里特指二层交换机)。
3）网关
网关 （Gateway）， 网关 顾名思义就是连接两个网络的设备，区别于路由器（由于历史的原因，许多有关TCP/IP 的文献曾经把网络层使用的路由器（Router）称为网关，在今天很多局域网采用都是路由来接入网络，因此现在通常指的网关就是路由器的IP），经常在家 庭中或者小型企业网络中使用，用于连接局域网和Internet。 网关也经常指把一种协议转成另一种协议的设备，比如语音网关。
在传统TCP/IP术语中，网络设备只分成两种，一种为网关（gateway），另一种为主机（host）。网关能在网络间转递数据包，但主机不能转送数据包。在主机（又称终端系统，end system）中，数据包需经过 TCP/IP 四层协议处理，但是在网关（又称中介系 统，intermediate system）只需要到达网际层（Internet layer），决定路径之后就可以转送。在当时，网关 （gateway）与路由器（router）还没有区别。
在现代网络术语中，网关（gateway）与路由器（router）的定义不同。网关（gateway）能在不同协议间移动数据，而路由器（router）是在不同网络间移动数据，相当于传统所说的IP网关（IP gateway）。
网关 是连接两个网络的设备，对于语音网关来说，他可以连接 PSTN 网络和以太网，这就相当于 VOIP ，把不同电话中的模拟信号通过网关而转换成数字信号，而且加入协议再去传输。在到了接收端的时候再通过 网关 还原成模拟的电话信号，最后才能在电话机上听到。
对于以太网中的 网关 只能转发三层以上数据包，这一点和路由是一样的。而不同的是 网关 中并没有路由表，他只能按照预先设定的不同网段来进行转发。网关最重要的一点就是端口映射，子网内用户在外网看来只是外网的IP地址对应着不同的端口，这样看来就会保护子网内的用户。
子网掩码及网络划分
随着互连网应用的不断扩大，原先的 IPv4 的弊端也逐渐暴露出来，即网络号占位太多，而主机号位太少，所以其能提供的主机地址也越来越稀缺，目前除了使用 NAT 在企业内部利用保留地址自行分配以外，通常都对一个高类别的IP地址进行再划分，以形成多个子网，提供给不同规模的用户群使用。
这里主要是为了在网络分段情况下有效地利用 IP 地址，通过对主机号的高位部分取作为子网号，从通常的网络位界限中扩展或压缩子网掩码，用来创建某类地址的更多子网。但创建更多的子网时，在每个子网上的可用主机地址数目会比原先减少。
什么是子网掩码？
子网掩码是标志两个IP地址是否同属于一个子网的，也是32位二进制地址，其每一个为1代表该位是网络位，为0代表主机位。它和IP地址一样也是使用点式十进制来表示的。如果两个 IP 地址在子网掩码的按位与的计算下所得结果相同，即表明它们共属于同一子网中。
在计算子网掩码时，我们要注意 IP 地址中的保留地址，即“0”地址和广播地址，它们是指主机地址或网络地址全为“0”或“1”时的IP地址，它们代表着本网络地址和广播地址，一般是不能被计算在内的。
子网掩码的计算：
对于无须再划分成子网的IP地址来说，其子网掩码非常简单，即按照其定义即可写出：如某B类IP地址为 10.12.3.0 ，无须再分割子网，则该IP地址的子网掩码 255.255.0.0 。如果它是一个C类地址，则其子网掩码为 255.255.255.0 。其它类推，不再详述。下面我们关键要介绍的是一个 IP 地址，还需要将其高位主机位再作为划分出的子网网络号，剩下的是每个子网的主机号，这时该如何进行每个子网的掩码计算。
下面总结一下有关子网掩码和网络划分常见的面试考题：
1）利用子网数来计算
在求子网掩码之前必须先搞清楚要划分的子网数目，以及每个子网内的所需主机数目。
将子网数目转化为二进制来表示;
如欲将 B 类 IP 地址 168.195.0.0 划分成27个子网：27 = 11011；
取得该二进制的位数，为 N ；
该二进制为五位数，N = 5
取得该 IP 地址的类子网掩码，将其主机地址部分的的前 N 位，置 1 ，即得出该IP地址划分子网的子网掩码。
将 B 类地址的子网掩码 255.255.0.0 的主机地址前 5 位，置 1，得到 255.255.248.0
2）利用主机数来计算
如欲将 B 类IP地址 168.195.0.0 划分成若干子网，每个子网内有主机 700 台：
将主机数目转化为二进制来表示；
700 = 1010111100；
如果主机数小于或等于 254（注意去掉保留的两个 IP 地址），则取得该主机的二进制位数，为 N，这里肯定 N < 8。如果大于 254，则 N > 8 ，这就是说主机地址将占据不止 8 位；
该二进制为十位数，N=10；
使用 255.255.255.255 来将该类IP地址的主机地址位数全部置 1 ，然后从后向前的将 N 位全部置为 0，即为子网掩码值。
将该B类地址的子网掩码255.255.0.0的主机地址全部置1，得到255.255.255.255，然后再从后向前将后 10位置0,即为： 11111111.11111111.11111100.00000000 ，即 255.255.252.0 。这就是该欲划分成主机为 700 台的 B 类 IP 地址 168.195.0.0 的子网掩码。
3）还有一种题型，要你根据每个网络的主机数量进行子网地址的规划和计算子网掩码。这也可按上述原则进行计算。
比如一个子网有10台主机，那么对于这个子网需要的IP地址是：
10 ＋ 1 ＋ 1 ＋ 1 ＝ 13
注意：加的第一个 1 是指这个网络连接时所需的网关地址，接着的两个 1 分别是指 网络地址 和 广播地址 。
因为 13 小于 16 （ 16 等于 2 的 4 次方），所以主机位为 4 位。而 256 － 16 ＝ 240，所以该子网掩码为 255.255.255.240 。
如果一个子网有 14 台主机，不少人常犯的错误是：依然分配具有 16 个地址空间的子网，而忘记了给网关分配地址。这样就错误了，因为 14 ＋ 1 ＋ 1 ＋ 1 ＝ 17，17 大于 16，所以我们只能分配具有 32 个地址（32 等于 2 的 5 次方）空间的子网。这时子网掩码为： 255.255.255.224。


使用 Markdown + MathJax 在博客里插入数学公式
2017-03-03T01:01:42.000Z
在书写数值计算类文章，难免需要插入复杂的数学公式。一种是用图片在网页上展示，另外一种是使用 MathJax 来展示复杂的数学公式。
它直接使用 Javascript 使用矢量字库或 SVG 文件来显示数学公式。优点是效果好，比如在 Retina 屏幕上也不会变得模糊。并且可以直接把公式写在 Markdown 文章里。本文介绍在 Sublime 中使用 MathJax 在 Markdown 文件里直接插入数学公式。并且附带一个简单的书写数学公式的 LaTex 教程。
工具
配置 Markdown Preview 来支持 MathJax
使用 Sublime + Markdown Preview 插件来写博客时。需要开启 Markdown Preview 对 MathJax 的支持，这样在预览界面才能正确地显示数学公式。方法是打开在 Markdown Preview 的用户配置文件 (Package Settings -> Markdown Preview -> Setting - User) 里添加如下内容：
"enable_mathjax": true
配置 Pelican 主题模板来支持 MathJax
如果博客不支持 MathJax 可以在模板中添加如下脚本


LaTex 简明教程
规则
关于在 Markdown 书写 LaTex 数学公式有几个规则常用规则需要记住：
行内公式 行内公式使用 $ 和 $ 作为公式的左右边界，如 \(h(x) = \theta_0 + \theta_1 x\) 公式的 LaTex 内容如下
$h(x) = \theta_0 + \theta_1 x$
行间公式 公式需要独立显示一行时，使用 $$ 来作为公式的左右边界，如
\[\theta_i = \theta_i - \alpha\frac\partial{\partial\theta_i}J(\theta)\]
的 LaTex 代码为：
$$
\theta_i = \theta_i - \alpha\frac\partial{\partial\theta_i}J(\theta)
$$
常用 LaTex 代码 需要记住的几个常用的符号，这样书写起来会快一点
编码 说明 示例
分子分母之间的横线 \(1x\)
_ 用下划线来表示下标 \(x_i\)
^ 次方运算符来表示上标 \(x^i\)
累加器，上下标用上面介绍的编码来书写 \(\)
希腊字母 alpha \(y := x\)
要特别注意公式里空格和 {} 的运用规则。基本原则是，空格可加可不加，但如果会引起歧义，最好加上空格。{} 是用来组成群组的。比如写一个分式时，分母是一个复杂公式时，可以用 {} 包含起来，这样整个复杂公式都会变成分母了。
几个非常有用的资源
这是一篇质量很高的介绍 MathJax 的中文博客文章，需要注意的是如果是用 markdown 编写 MathJax 公式，当公式里需要两个斜杠  时要写四个斜杠 。因为  会被 markdown 转义一次。
Github 上有个在线 Markdown MathJax 编辑器，可以在这里练习，平时写公式时也可以在这里先写好再拷贝到文章里
这是 LaTex 完整教程，包含完整的 LaTex 数学公式的内容，包括更高级的格式控制等
这是一份PDF 格式的 MathJax 支持的数学符号表，当需要书写复杂数学公式时，一些非常特殊的符号的转义字符可以从这里查到
好啦，这样差不多就可以写出优美的数学公式啦。
本文参考 kamidox.com


MyBatis 的简单案例
2017-02-14T01:01:42.000Z
一个稍复杂的 MyBatis 连结数据库的案例，涉及多表查询，以及稍复杂的 SQL 语句
共三张表：学生表 student，班级表 class，分数表 score
案例为
1.查询 张三 的 数学 成绩 2.查询 三班 全体成员成绩 3.查询 数学 第4，5，6名的 学生姓名
导入 jar 包
博主使用的是 MySQL 数据库，所以需要导一些 jar 包
新建一个 java project , 在工程下新建文件夹，命名为 lib ，将MySQL 的驱动文件 和 MyBatis 的驱动文件 复制到该文件夹，并右键 Build Path -> Add to Build Path 。这时发现在工程里出现 Referenced Libraries ，里面有和刚才同名的 jar 文件。
创建数据库
建表
建表的 sql 语句如下(为了方便没有外键)
create table class(
    classno int primary key,
    classname varchar(20)
);

create table student(
    studentno int primary key,
    studentname varchar(20),
    sex varchar(10),
    classno int
);

create table score(
    scoreid int primary key,
    studentno int,
    object varchar(20),
    score float
);
插入数据
插入数据的 sql 语句如下
INSERT INTO `class` (`classno`, `classname`) VALUES ('1', '一班');
INSERT INTO `class` (`classno`, `classname`) VALUES ('2', '二班');
INSERT INTO `class` (`classno`, `classname`) VALUES ('3', '三班');

INSERT INTO `student` (`studentno`, `studentname`, `sex`, `classno`) VALUES ('1', '张三', '男', '1');
INSERT INTO `student` (`studentno`, `studentname`, `sex`, `classno`) VALUES ('2', '李四', '女', '2');
INSERT INTO `student` (`studentno`, `studentname`, `sex`, `classno`) VALUES ('3', '王五', '女', '1');
INSERT INTO `student` (`studentno`, `studentname`, `sex`, `classno`) VALUES ('4', '吴六', '男', '2');
INSERT INTO `student` (`studentno`, `studentname`, `sex`, `classno`) VALUES ('5', '赵七', '男', '3');
INSERT INTO `student` (`studentno`, `studentname`, `sex`, `classno`) VALUES ('6', '孙八', '女', '3');

INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('1', '1', '语文', '99');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('2', '1', '数学', '98');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('3', '2', '语文', '92');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('4', '2', '数学', '94');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('5', '3', '语文', '95');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('6', '3', '数学', '93');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('7', '4', '语文', '97');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('8', '4', '数学', '96');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('9', '5', '语文', '94');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('10', '5', '数学', '93');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('11', '6', '语文', '94');
INSERT INTO `score` (`scoreid`, `studentno`, `object`, `score`) VALUES ('12', '6', '数学', '95');
配置文件连接数据库
db.properties
首先配置连结数据库文件，在 src 下新建文件，名称为 db.properties ，内容如下，其中 20170214 为数据库名称，需要改成你自己的数据库名字。
jdbc.driver = com.mysql.jdbc.Driver
jdbc.url = jdbc:mysql://localhost:3306/20170214?useUnicode=true&characterEncoding=utf-8
jdbc.username = root
jdbc.password = root
SqlMapConfig.xml
在 src 下新建一个 SqlMapConfig.xml 文件，内容为：


PUBLIC "-//mybatis.org//DTD Config 3.0//EN"
"http://mybatis.org/dtd/mybatis-3-config.dtd">
<configuration>
    
    <properties resource="db.properties"/>
    <environments default="development">
        <environment id="development">
            
            <transactionManager type="JDBC"/>
            
            <dataSource type="POOLED">
                <property name="driver" value="${jdbc.driver}"/>
                <property name="url" value="${jdbc.url}"/>
                <property name="username" value="${jdbc.username}"/>
                <property name="password" value="${jdbc.password}"/>
            dataSource>
        environment>
    environments>
    <mappers>
        <package name="mapper"/>
    mappers>
configuration>
新建 pojo 对象类
在 src 下新建一个包，包名为 pojo，然后根据数据库列名新建 student, class, score 三个类，注意列名与对象名应一致，并进行set, get方法
Class.java
package pojo;
public class Class {
    private int classno;
    private String classname;
    public int getClassno() {
        return classno;
    }
    public void setClassno(int classno) {
        this.classno = classno;
    }
    public String getClassname() {
        return classname;
    }
    public void setClassname(String classname) {
        this.classname = classname;
    }
}
Student.java
package pojo;
public class Student {
    private int studentno;
    private String studentname;
    private String sex;
    private int classno;
    public int getStudentno() {
        return studentno;
    }
    public void setStudentno(int studentno) {
        this.studentno = studentno;
    }
    public String getStudentname() {
        return studentname;
    }
    public void setStudentname(String studentname) {
        this.studentname = studentname;
    }
    public String getSex() {
        return sex;
    }
    public void setSex(String sex) {
        this.sex = sex;
    }
    public int getClassno() {
        return classno;
    }
    public void setClassno(int classno) {
        this.classno = classno;
    }
}
Score.java
package pojo;
public class Score {
    private int scoreid;
    private String studentname;
    private String object;
    private float score;
    public int getScoreid() {
        return scoreid;
    }
    public void setScoreid(int scoreid) {
        this.scoreid = scoreid;
    }
    public String getStudentname() {
        return studentname;
    }
    public void setStudentname(String studentname) {
        this.studentname = studentname;
    }
    public String getObject() {
        return object;
    }
    public void setObject(String object) {
        this.object = object;
    }
    public float getScore() {
        return score;
    }
    public void setScore(float score) {
        this.score = score;
    }
}
配置接口映射
StudentMapper.java
package mapper;

public interface StudentMapper {
    public int queryScoreByNameAndObject(String name, String object) throws Exception;
}
新建 SQL 语句映射文件 StudentMapper.xml


<mapper namespace="mapper.StudentMapper">
    <select id="queryScoreByNameAndObject" parameterType="pojo.FirstParameter"  resultType="pojo.FirstResult">
        select a.studentname, b.score, b.object
          from student a, score b
         where a.studentno = b.studentno
           and a.studentname =#{studentname}
           and b.object = #{object}
    select>
mapper>
由 SQL 语句得知这是两个表的查询语句 传入参数有 studentname, object, 传出参数有 a.studentname, b.object, b.score。
以上数据因为都是从两个表中获取，所以需要再写两个 pojo 类：FirstParameter.java 和 FirstResult.java
FirstParameter.java
package pojo;

public class FirstParameter {
    private String studentname;
    private String object;
    private String getStudentname() {
        return studentname;
    }
    public void setStudentname(String studentname) {
        this.studentname = studentname;
    }
    public String getObject() {
        return object;
    }
    public void setObject(String object) {
        this.object = object;
    }
}
FirstResult.java
package pojo;

public class FirstResult {
    private String studentname;
    private float score;
    private String object;
    public String getStudentname() {
        return studentname;
    }
    public void setStudentname(String studentname) {
        this.studentname = studentname;
    }
    public float getScore() {
        return score;
    }
    public void setScore(float score) {
        this.score = score;
    }
    public String getObject() {
        return object;
    }
    public void setObject(String object) {
        this.object = object;
    }
}
测试类
package test;

import java.io.IOException;
import java.io.InputStream;
import java.util.HashMap;
import java.util.Map;

import org.apache.ibatis.io.Resources;
import org.apache.ibatis.session.SqlSession;
import org.apache.ibatis.session.SqlSessionFactory;
import org.apache.ibatis.session.SqlSessionFactoryBuilder;

import pojo.FirstResult;
import pojo.FirstParameter;




public class Test {
    public static void main(String[] args) throws IOException {
        InputStream is = Resources.getResourceAsStream("SqlMapConfig.xml");
        SqlSessionFactory sqlSessionFactory = new SqlSessionFactoryBuilder().build(is);
        SqlSession session=sqlSessionFactory.openSession();
        // 查询张三的语文成绩
        FirstParameter d=new FirstParameter();
        d.setStudentname("张三");
        d.setObject("语文");
        FirstResult q=session.selectOne("queryScoreByNameAndObject", d);
        if(q!=null){
            System.out.println(q.getStudentname()+":"+q.getScore());
        }
    }
}



Markdown 简明语法手册
2017-02-07T01:01:42.000Z
Markdown 是文本 在此，我们总结 Markdown 的优点如下：
纯文本，所以兼容性极强，可以用所有文本编辑器打开。 让你专注于文字而不是排版。 格式转换方便，Markdown 的文本你可以轻松转换为 html、电子书等。 Markdown 的标记语法有极好的可读性。
粗体，斜体，删除线
代码如下：
**粗体**
*斜体*
~~删除线~~
显示效果：
粗体
斜体
删除线
分级标题
可以行首加井号表示不同级别的标题 (H1-H6)，代码如下：
# H1
## H2
### H3
#### H4
##### H5
###### H6
因为该代码会加入目录里，所以不做演示了。
外链接
代码如下：
[本人博客](http://xungejiang.com "xunge的博客")
[本人博客](http://xungejiang.com)
显示效果：
本人博客 本人博客
链接后的 title 需要用引号括起来，可以选填，效果是鼠标放到链接上会有提示。
如果安装了 MarkdownExtended 插件的话，可以使用 mdl + tab 键
需要注意的是，使用 Markdown 方法，默认是在本网页打开新网页，如果想在新的标签页上打开链接，只能使用 HTML 语言实现，代码如下：
本人博客
显示效果：
本人博客
插入图片
普通 markdown 语法
代码如下：
![小米](http://7xvx4s.com2.z0.glb.qiniucdn.com/mi.jpg "小米")
显示效果：
小米
如果安装了 MarkdownExtended 插件的话，可以使用 mdi + tab 键
需要注意的是，使用 Markdown 方法，图片将不能调整大小，有以下两种方式可以调整大小
HTML 语法
使用 HTML 语言实现，代码如下：

显示效果：
使用支持参数的图床
可以使用支持参数的图床，例如七牛，可参考七牛图片基本处理。
例如代码为：
![小米](http://7xvx4s.com2.z0.glb.qiniucdn.com/mi.jpg "小米")                     //旧方法
![小米](http://7xvx4s.com2.z0.glb.qiniucdn.com/mi.jpg?imageView2/2/w/200 "小米")  //新方法
显示效果：
小米
imageView2/2/w/200 的意义为 宽度固定为200px，高度等比缩小。
代码块
行内代码
用反引号将短代码框住，代码如下：
这是 `行内代码`
显示效果：
这是 行内代码
多行代码
多行代码有两种表示方式。
一种是用前后两个 ``` 把代码包围起来，并在第一行后面标注哪种语言，即可实现代码高亮。注意 ` 不是单引号而是左上角的ESC下面~中的 `
代码如下：
CREATE TABLE stu (
    stu_no INT(20),
    stu_name VARCHAR(20) NOT NULL,
    stu_tel VARCHAR(15),
    CONSTRAINT pk_stu_no PRIMARY KEY (stu_no),
    CONSTRAINT uk_stu_tel UNIQUE KEY (stu_tel)
);
显示效果：
CREATE TABLE stu (
    stu_no INT(20),
    stu_name VARCHAR(20) NOT NULL,
    stu_tel VARCHAR(15),
    CONSTRAINT pk_stu_no PRIMARY KEY (stu_no),
    CONSTRAINT uk_stu_tel UNIQUE KEY (stu_tel)
);
另一种是把代码选中后按一下 tab 键，缺点是无法识别代码语言，无法高亮。
列表
无序列表
使用 *，+，- 任意一种表示无序列表，代码如下：
- 无序列表项 一
+ 无序列表项 二
* 无序列表项 三
* 无序列表项 四
+ 无序列表项 五
+ 无序列表项 六
- 无序列表项 七
显示效果：
无序列表项 一无序列表项 二无序列表项 三
无序列表项 四
无序列表项 五
无序列表项 六
无序列表项 七
有序列表
代码如下：
1. 有序列表项 一
2. 有序列表项 二
3. 有序列表项 三
显示效果：
有序列表项 一
有序列表项 二
有序列表项 三
引用
代码如下：
> 引用文字 一
显示效果：
引用文字 一
表格
第一行为表头，第二行分隔表头和主体部分，默认 - 左对齐， :-: 居中对齐， -: 右对齐，第三行开始每一行为一个表格行，代码如下：
这是第一列 左对齐|这是第二列 中间对齐|这是第三列 右对齐
-|:-:|-:
小姜|男|99
小宫|女|100
小刘|男|98
显示效果：
这是第一列 左对齐 这是第二列 中间对齐 这是第三列 右对齐
小姜 男 99
小宫 女 100
小刘 男 98
分割线
三个以上的星号、减号、底线线来建立一个分隔线，效果相同，代码如下：
---
***
___
显示效果：
上下角标
 和  中间的为下角标  和  中间的为上角标
H₂O
E=mc²
显示效果： H₂O E=mc²
也可以用下面介绍的 LaTex 公式，更方便。
LaTeX 公式
\\( 和 \\) 表示行内公式：
代码：
质能守恒方程可以用一个很简洁的方程式 \\(E=mc^2\\) 来表达。
显示效果：
质能守恒方程可以用一个很简洁的方程式 \(E=mc^2\) 来表达。
$$ 表示整行公式：
代码：
$$
\sum_{i=1}^n a_i=0
$$

$$
f(x_1,x_x,\ldots,x_n) = x_1^2 + x_2^2 + \cdots + x_n^2
$$

$$
\sum^{j-1}_{k=0}{\widehat{\gamma}_{kj} z_k}
$$
显示效果：
\[\sum_{i=1}^n a_i=0\]
\[f(x_1,x_x,\ldots,x_n) = x_1^2 + x_2^2 + \cdots + x_n^2\]
\[\sum_{k=0}^{j-1} {\widehat{\gamma}_{kj} z_k}\]
查看 Sublime 如何配置 LaTex 可参考 我写的这篇文章
以上。


jQuery 的基本使用方法
2017-02-07T01:01:42.000Z
jQuery 是一个 JavaScript 库，极大地简化了 JavaScript 编程。本文对 jQuery 知识点进行总结，更多的知识点请查看 官方文档 或 W3School教程
推荐一个 HTML 的编辑器 HBuilder , 当然 sublime 也是极好的。
安装 jQuery
可以通过多种方法在网页中添加 jQuery。 您可以使用以下方法：
从 jquery.com 下载 jQuery 库
从 CDN 中载入 jQuery
下载 jQuery
将下载的文件放在网页的同一目录下，并用

类型	型号	数量
GPU	技嘉RTX2080Ti TURBO 11G	4
CPU	i9-9820X 10核/20线程	1
CPU散热	美商海盗船 H150i PRO	1
主板	技嘉 X299-WU8	1
机箱	先马掠食者V1	1
内存	美商海盗船复仇者LPX DDR4 3000 16GB	8
电源	振华额定2000W LEADEX P 2000电源	1
PCIE固态硬盘	三星 1TB SSD固态硬盘 970 EVO	1
SATA固态硬盘	三星 1TB SSD固态硬盘 860 EVO	1

软件	版本号
macOS High Sierra	10.13.4
TensorFlow	1.8
python	3.6.4
NVIDIA Web-Drivers	387.10.10.10.30.106
CUDA-Drivers	387.178
CUDA Toolkit	9.1
cuDNN	7.0.5
bazel	0.10.0
Xcode	8.3.2
Command Line Tools for Xcode	8.3.2

配件	品牌	价格
CPU	i7-7700k(散)	2078￥
显卡	索泰 GTX1060 6G	1899￥(-200)
主板	微星 Z270 gaming pro carbon	1375￥(-224)
内存条	英睿达 DDR4 2400 8G	主板赠(-339)
固态硬盘	三星 PM961 256G	629￥
机械硬盘	希捷酷鱼 7200转 2T	329￥(-80)
散热器	九州风神大霜塔	179￥(-40)
电源	海韵 G-550	419￥(-80)
机箱	先马黑洞	289￥(-10)
显示器	戴尔 U2417h	1474(-175)

品牌	价钱	颗粒	读/写(MB/S)
英特尔 600p	660￥	TLC	1570/540
建兴 T10	680￥	MLC	2700/1300
三星960 evo	900￥	TLC	3200/1800
SM 961	850￥	MLC	3200/1400
PM 961	680￥	TLC	2800/1100

接口	名称	功能
①	AUD1	耳机与麦克风接口
②	JFP1	机箱开机键、指示灯等接口
③	JUSB1	机箱前面板USB
④	SATA	接硬盘、光驱
⑤	JUSB3	机箱前面板USB
⑥	ATX_PWR1	主板供电线
⑦	SYS_FAN4	CPU散热副风扇供电线
⑧	CPU_FAN1	CPU散热主风扇供电线
⑨	CPU_PWR1	CPU供电线

正则表达式	说明	正确示例	错误示例
.	匹配任何单个符号，包括所有字符	(“..”, “a%”) – true	(“..”, “a”) – false
^xxx	在开头匹配正则xxx	(“^a.c.”, “abcd”) – true	(“^a”, “ac”) – false
xxx\\(\|在结尾匹配正则xxx\|(“..cd\\\)”, “abcd”) – true	(“a\$”, “aca”) – false
[abc]	能够匹配字母a,b或c	(“¹d.”, “ad9”) – true	(“[ab]x”, “cx”) – false
[^abc]	当^是[]中的第一个字符时代表取反	(“[^ab][^12].”, “c3#”) – true	(“[^ab][^12]“, “c2″) – false
[a-e1-8]	匹配a到e或者1到8之间的字符	(“[a-e1-3].”, “d#”) – true	(“[a-e1-3]“, “f2″) – false
xx\	yy	匹配正则xx或者yy	(“x.\

正则表达式	说明
x?	x没有出现或者只出现一次
X*	X出现0次或更多
X+	X出现1次或更多
X{n}	X正好出现n次
X{n,}	X出席n次或更多
X{n,m}	X出现至少n次但不多于m次

类别	最大网络数	IP地址范围	最大主机数
A	126（2^7-2)	0.0.0.0-127.255.255.255	16777214
B	16384(2^14)	128.0.0.0-191.255.255.255	65534
C	2097152(2^21)	192.0.0.0-223.255.255.255	254

--	TCP	UDP
连接性	面向连接	无连接
可靠性	可靠	不可靠
报文	面向字节流	面向报文
应用场合	传输大量的数据	少量数据
速度	慢	快
流量控制	有	无
拥塞控制	有	无

服务	端口号	服务	端口号
FTP	21	SSH	22
telnet	23	SMTP	25
Domain(域名服务器)	53	HTTP	80
POP3	110	NTP（网络时间协议）	123
MySQL数据库服务	3306	Shell或 cmd	514
POP-2	109	SQL Server	1433

编码	说明	示例
	分子分母之间的横线	\(1x\)
_	用下划线来表示下标	\(x_i\)
^	次方运算符来表示上标	\(x^i\)
	累加器，上下标用上面介绍的编码来书写	\(\)
	希腊字母 alpha	\(y := x\)

XUNGE's Blog

LXD报错：Error LXD unix socket not accessible Get "http://unix.socket/1.0" EOF

Zerotier 搭建 Moon 节点并支持动态 IP（DDNS）

搭建 moon 节点

生成 moon.json

生成签名文件

自动更新 Moon 节点 IP

完整步骤！如何使用LXD构建多人使用GPU服务器

格式化硬盘

换 apt 源

固定内核版本

配置宿主机网络

安装 lxd、zfs 及 bridge-utils

安装宿主机显卡驱动

LXD 初始化

创建容器

更改容器名

为容器添加设备和权限

制作容器模板

更换容器的 apt 源

配置容器网络

更改容器用户名和密码

配置容器 ssh 连接

添加初始化容器脚本

安装容器的显卡驱动

创建容器快照

创建容器脚本

解决重启宿主机导致容器显卡驱动找不到的问题

安装 Anaconda

安装 PyTorch

设置开机自启动命令

设备序列号 硬盘序列号 等查询方法

windows

设备序列号

硬盘序列号

操作系统安装时间

IP地址 MAC地址

Linux

设备序列号

硬盘序列号

操作系统安装时间

IP地址 MAC地址

m1 mac 将系统装入外置硬盘

硬盘盒和硬盘

格式化硬盘

下载系统

进入恢复模式进行安装

黑苹果转白苹果心得

GCC 编译多平台二进制程序（x64, ARM, MIPS）

准备工作

编译 x64 平台

编译 MIPS 平台

编译 ARM 平台

PyTorch 的 BERT 微调教程

介绍

历史

什么是 BERT?

微调的优势

NLP的转变

1. 设置

1.1. 检查 GPU

1.2. 安装 HuggingFace 库

2. 加载 CoLA 数据集

2.1. 下载和解压

2.2. 解析

3. Tokenization & Input 格式化

3.1. BERT Tokenizer

3.2. 需要的格式化

特殊 Tokens

句子长度 & 注意力遮盖

3.3. Tokenize 数据集

3.4. 训练 & 验证切分

4. 训练我们的分类模型

4.1. BertForSequenceClassification

4.2. 优化器 & 学习率调度器

4.3. 训练循环

5. 测试集的性能

5.1. 数据准备

5.2. 测试集上进行评估

结论

设备序列号硬盘序列号等查询方法