分类软件与环境配置下的文章 - Masimaro's blog

首页归档友情链接关于

1 在wsl2中安装archlinux 179 阅读 2 nvim番外之将配置的插件管理器更新为lazy 120 阅读 3 2018总结与2019规划 104 阅读 4 从零开始配置 vim(15)——状态栏配置 91 阅读 5 PDF标准详解（五）——图形状态 71 阅读

软件与环境配置读书笔记编程 Thinking FIRE 菜谱翻译

登录

标签搜索

c++
c
学习笔记
windows
文本操作术
编辑器
NeoVim
Vim
win32
emacs
VimScript
linux
读书笔记
elisp
文本编辑器
Java
反汇编
OLEDB
数据库编程
数据结构

Masimaro

累计撰写 348 篇文章
累计收到 32 条评论

首页
栏目
- 软件与环境配置
- 读书笔记
- 编程
- Thinking
- FIRE
- 菜谱
- 翻译
页面

搜索到 109 篇与的结果

2025-03-28
Emacs 折腾日记(二十)——修改emacs的一些默认行为上一篇我们完成了emacs输入法的配置以及将emacs配置成了使用vim的操作方式。但是emacs目前有些默认行为我不太喜欢，这节我们一起来修改它备份设置我们打开emacs的配置文件所在路径，发现有大量的~结尾的文件，这是emacs的备份文件。这里，我们不使用这个特性，可以通过git等版本管理软件进行版本的控制和备份的管理。而且去掉这些还能让目录干净点。(setq make-backup-files nil) ; 不自动备份 (setq auto-save-default nil) ; 不使用Emacs自带的自动保存将用户设置独立开来在修改这些配置的时候经常会发现在init.el 中出现类似下面的代码被修改(custom-set-variables ;; custom-set-variables was added by Custom. ;; If you edit it by hand, you could mess it up, so be careful. ;; Your init file should contain only one such instance. ;; If there is more than one, they won't work right. '(package-selected-packages nil)) (custom-set-faces ;; custom-set-faces was added by Custom. ;; If you edit it by hand, you could mess it up, so be careful. ;; Your init file should contain only one such instance. ;; If there is more than one, they won't work right. )这里保存的是使用编辑器接口产生的配置信息。如果让它们随意堆砌在init.el 中不利于版本的管理，我们将它放入到另一个文件中(setq custom-file (expand-file-name "~/.emacs.d/custom.el")) (load custom-file 'no-error 'no-message)之前我们用 require 来加载一个代码文件，这里我们使用 load 来加载代码文件。它们有什么区别呢？首先 require 需要加载一个已经被定义为库的代码文件，也就是通过 provide 定义的库文件。而load传入文件路径来加载其次 require 会根据 provide 定义的库文件自动处理库文件，每个库文件只加载一次，并且会自动处理依赖。而 load 这些操作都需要手动进行load 可以根据if条件来有选择的加载不同的库文件。而 require 则无法做到load 可以进行错误处理，例如上面我们定义在加载时通过 noerror 限制错误，通过 no-message 不输出信息。而 require 是严格报错的。其他的一些基础设置这里再添加一些其他的基础配置(fset 'yes-or-no-p 'y-or-n-p) ;; 将所有的 yes-or-no-p 都替换为 y-or-n-p (setq confirm-kill-emacs #'y-or-n-p) ; 在关闭 Emacs 前询问是否确认关闭，防止误触 (electric-pair-mode t) ; 自动补全括号 (column-number-mode t) ; 在 Mode line 上显示列号 (global-auto-revert-mode t) ; 当另一程序修改了文件时，让 Emacs 及时刷新 Buffer (delete-selection-mode t) ; 选中文本后输入文本会替换文本（更符合我们习惯了的其它编辑器的逻辑） (add-hook 'prog-mode-hook #'hs-minor-mode) ; 编程模式下，可以折叠代码块 (add-hook 'prog-mode-hook #'show-paren-mode) ; 编程模式下，光标在括号上时高亮另一个括号(fset 'yes-or-no-p 'y-or-n-p) 将所有的 yes-or-no-p 都替换为 y-or-n-p。这样在每次确定的时候能从 yes 或者 no的输入变成输入 y 或者 n，能少输入几个字符。这里又看到了一个新的符号# ，它代表的意思是取符号的函数部分。前面我们介绍符号的时候说，符号有两个部分的值，变量值和函数值。我们可以通过 function 来获取符号的函数部分的值。它的作用等同于 `(setq confirm-kill-emacs (function y-or-n-p))` 。这里又有一个新的函数 function。我们在介绍符号的时候介绍过使用 symbol-function 来获取符号的函数，那么他们两个有什么区别呢？首先 function 返回的是函数对象，而 symbol-function 返回函数本身。这个比较的抽象，我们使用例子来说明(setq bar "I am a bar variable") (defun bar() "I am a bar function") (function bar) ;; ==> bar (symbol-function 'bar) ;; ==> #[nil ("I am a bar function") (t)] (functionp bar) ;; ==> nil (functionp (function bar)) ;; ==> t上面的例子中，我们实际上定义了bar的变量部分和函数部分的值。同一 bar 符号它既可以作为变量使用，也可以作为函数使用。我们在使用 function 对 bar 求值的时候，得到的返回虽然也是 bar 但是它返回的是它的函数部分，而 symbol-function 则直接返回函数的结构，因为lisp代码本身就是一个列表结构，所以这里它返回的实际上是函数的代码。它返回的比 function 更加的底层。下面我们使用 functionp 进行了测试，发现 function 返回的是一个函数对象。虽然在理解上有些差别，但是都可以直接通过 funcall 来调用(bar) ;; ==> "I am a bar function" (funcall bar) ;; ==> error (funcall (function bar)) ;; ==> "I am a bar function" (funcall (symbol-function 'bar)) ;; ==> "I am a bar function"我们发现当一个符号既有值部分，又有函数部分，是无法通过 funcall 来直接调用的。所以上述代码使用 # 这个语法糖来保证后续正常调用这个符号对应的函数部分。
- 2025年03月28日
- 11 阅读
- 0 评论
- 0 点赞
2025-03-25
Emacs 折腾日记(十九)——配置输入法和vim操作方式上一篇文章中，我们将Emacs变得稍微好看了点。换成了自己喜欢的主题和颜色，这样每天用起来也比较养眼，不会特别排斥。本篇文章的主要任务就是配置输入法方便输入中文以及将vim的操作模式搬到Emacs中。进一步提到Emacs的可用性配置中文输入法系统基本环境配置在配置输入法之前，需要系统支持中文，并且有对应的中文字体可以显示中文，而且还需要对应的输入法框架支持。首先我们安装中文字体和语言包，本人之前有一篇介绍如何搭建wsl2+archlinux的文章，已经完成了这一步。但是为了没看过那篇文章的读者不用再去费劲的找那篇文章，我还是把命令贴出来：sudo pacman -S wqy-zenhei wqy-microhei noto-fonts-cjk # 安装中文字体 sudo pacman -S fcitx5-im fcitx5-chinese-addons # 安装中文输入法框架及中文引擎 sudo pacman -S fcitx5-qt fcitx5-gtk # GUI支持接着配置 Locale ，我们需要编辑 /etc/locale.gen 文件，取消下面两行的注释en_US.UTF-8 UTF-8 zh_CN.UTF-8 UTF-8编辑完成之后，调用 sudo locale-gen 命令生成 locale。接着我们需要在 ~/.bashrc 或者 ~/.zshrc 又或者其他shell的配置文件中加入输入法的配置export GTK_IM_MODULE=fcitx5 export QT_IM_MODULE=fcitx5 export XMOIFIERS=@im=fcitx5然后我们启动fcitx5服务dbus-launch fcitx5 --disable=wayland -d &这个时候我们可以启动emacs，并且执行 M-x toggle-input-method 或者使用 C-\ 来切换输入法。只是默认的 chinese-py 输入法比较难用。所以我们需要换一个输入法并且给出拼音的词库emacs-rime 配置这个配置是我在 Emacs-China论坛的一篇文章中发现这个输入法。可以访问输入法源代码地址，它已发布到 Melpa，所以我们可以通过use-package 或者emacs自带的package来安装和管理。这里还是使用 use-package在安装之前，需要安装librime 和 fcitx5-rime。在arch中使用sudo pacman -S librime fcitx5-rime接着安装雾凇拼音，但是根据emacs-rime 官方文档的说法，最好不要将~emacs-rime~ 与 ~fcitx-rime~ 共用用户数据目录。所以这里我们我们将它放到其他目录git clone https://github.com/iDvel/rime-ice ~/.config/rime --depth=1然后我们进行emacs-rime的配置和安装(use-package rime :ensure t :custom (default-input-method "rime") (rime-posframe-properties (list :background-color "#333333" :foreground-color "#dcdccc" :font "WenQuanYi Micro Hei Mono-14" :internal-border-width 10)) (rime-user-data-dir "~/.config/rime") (rime-show-candidate 'posframe))到这里我们使用 C-\ 就可以愉快的输入中文了Vim 操作方式本系列文章并没有像一般的Emacs教程那样给各位读者介绍Emacs的操作和快捷键。因为我觉得Emacs可以很方便的变成跟vim一样的编辑器，既然读者们都熟悉vim，那就没必要单独的学习一套Emacs操作，直接继承vim的操作就行。这里说一个题外话，我觉得一个编辑器如果不支持vim的操作模式，要么就是使用的人不多，要么就是不够开放。对我来说这种编辑器平时就没有学习和使用的必要了。我们使用evil 插件来模拟vim的操作。(use-package evil :ensure t :init (evil-mode))我们执行完这句代码之后会发现已经进入了vim的normal模式了。这个时候又可以愉快的使用vim的操作方式来编辑文本了。但是查阅了关于evil的文档后发现，evil本身并不支持像vim那样设置leaderkey，我们要结合其他插件来达到这一效果。我们使用 general 插件来模拟并设置leaderkey(use-package general :ensure t :config (general-evil-setup t))插件安装完成之后可以使用下面的代码来设置leaderkey(general-create-definer my-leader-def :states '(normal insert visual emacs) :prefix "SPC" :non-normal-prefix "C-,")这里使用 general 提供的 general-create-definer 来定义自己的leader键，它可以定义leader键的作用范围和触发方式。my-leader-def 是一个符号它代表着我们在这里定义的leader键，后续可以通过它来结合其他按键来实现快捷键绑定。这里的 :states 表示作用的范围，在启用evil插件之后我们在 normal、insert、visual、emacs 这几个模式中启用这个leader键。通过 :prefix 定义leader键，这里我定义leader键为空格。最后一个参数 :non-normal-prefix 定义在非normal 模式下使用 C-, 来作为leader键。后面我们就可以通过这个 my-leader-def 这个符号来绑定快捷键了。下面提供一个例子来演示如何绑定快捷键。前面介绍vim相关内容的时候提到过，我们使用 <leader>ee 来快速打开配置文件，使用 <leader>ss 来重新加载配置，在这里实现以下emacs版本的这套功能。我们先来实现这两个功能函数(defun open-my-emacs-config() (interactive) (find-file "~/.emacs.d/init.el")) (defun source-my-emacs-config() (interactive) (eval-buffer (get-buffer "~/.emacs.d/init.el")))实现了这样的函数之后就是针对这些命令来绑定快捷键了。我们使用下面的代码来绑定(my-leader-def "ss" 'open-my-emacs-config) (my-leader-def "ee" 'source-my-emacs-config)至此我们使用evil 和 general 插件完成了一个简单的Emacs vim化的改造。利用这些简单的配置后面在使用的时候应该会更加的得心应手。随着代码越来越多，需要用git管理起来，每篇文章更新的代码我都会传到GitHub上供读者参考本篇代码
- 2025年03月25日
- 12 阅读
- 0 评论
- 0 点赞
2025-03-17
Emacs 折腾日记(十八)——改变Emacs的样貌截止到上一篇文章为止，之前教程的内容都看完了，虽然它的后记部分提供了一些后续进阶的内容需要我们自己读手册。但是我不太想继续在elisp上死磕了。看着自己学了那么久的elisp，但是自己的emacs仍然没有半点改变，这个时候各位读者的兴趣一定会大打折扣，是时候试试配置一下自己的emacs了。教程后记中提到的内容等配置的时候涉及到了再来了解吧所谓人靠衣装马靠鞍，一个编辑器好不好用首先要看的就是它好不好看，对于难看的编辑器可能一眼就要给它发卡了——“你是一个很优秀的编辑器，但是我们不合适”。所有配置时第一件事就是将emacs变帅变好看。emacs的基础配置Emacs 在加载的时候会首先读取 ~/.emcas.d/init.el 中的代码。整个配置程序的入口就在这里。但是如果我们一股脑将所有代码都写在这个文件中日后想要维护肯定是不方便的，所以在写配置之前需要了解一些它的模块化提供一个模块，我们只需要在代码文件最后的位置写上 (provide 'package-name) 这样的代码即可。这里的 provide。可以理解为导出，后面是导出模块的名称。在需要引入模块时，只需要添加一行 (require 'basic)。但是与其他语言类似，有时候会出现找不到对应的模块，这里涉及到一个查找路径的问题。Emacs 中加载路径被保存在变量 load-path 中。该变量是一个list，我们可以将指定路径放入到这个变量中来添加用户定义代码的路径。load-path 中的目录顺序决定了 Emacs 搜索文件的优先级。如果多个目录中存在同名的 Lisp 文件，Emacs 会优先加载 load-path 中靠前的目录中的文件。因此，你可以通过调整 load-path 的顺序来控制加载的优先级。为了添加路径到 load-path 中，我们要了解一个新的函数， add-to-list。为什么这里我们不使用 push 或者其他之前学过的操作list的函数呢？最关键的一点是 add-to-list 具有去重的功能，能避免多次重复加入同一个路径。如果我们将用户代码放入到 ~/.emacs.d/lisp 这个目录中，我们可以使用下面的代码;; init.el (add-to-list 'load-path "~/.emacs.d/lisp")前面的知识介绍完了，现在我们新建 ~/.emacs.d/lisp/basic.el 文件，进行基础的配置。目前添加的代码主要是取消Emacs上的滚动条、菜单栏、工具栏、以及每次打开的开始界面。;; basic.el ;; 禁止菜单栏、工具栏、滚动条模式，禁止启动屏幕和文件对话框 (menu-bar-mode -1) (tool-bar-mode -1) (scroll-bar-mode -1) (setq inhibit-splash-screen t) ;; 禁止启动画面 ;; 显示行号 (setq display-line-numbers-type 'relative) ;;显示相对行号 (global-display-line-numbers-mode 1) (provide 'basic)然后在启动的时候使用它;; init.el (add-to-list 'load-path "~/.emacs.d/lisp") (require 'basic)重启Emacs就能看到具体的效果了使用包管理器要想它变的好看，最好的办法是加载开源大佬提供的主题。作为一个小菜鸡不太可能自己开发重型的功能，我们要做的这是将大佬提供的包整合到自己的配置中。所以我们先来介绍包和包管理器。这里的包我们可以理解为提供了某种功能的模块，有点类似与C/C++ 的静态库或者Java的类库。Emacs中的包管理主要通过 package.el 模块提供。它包含了模块的查找，下载，更新以及删除等操作。它的一些常用命令如下:M-x list-packages：列出所有可用的包，并进入包管理界面。M-x package-install：安装指定的包。M-x package-refresh-contents：刷新包列表，获取最新的包信息。M-x package-upgrade：更新所有已安装的包。M-x package-delete：删除指定的包。Emacs中默认的仓库是 Emacs 默认使用 MELPA（Milkypostman’s Emacs Lisp Package Archive）作为主要的包仓库。MELPA 提供了大量高质量的第三方包。除此之外，还有其他仓库，如：GNU ELPA：官方仓库，包含 Emacs 自带的包。MELPA Stable：提供稳定版本的包。NonGNU ELPA：包含一些非 GNU 的包。因为国内的网络环境，我们常常需要使用国内的源。这里我们创建一个新的文件 package 用来管理包。;; package-conf.el (require 'package) (setq package-enable-at-startup nil) (setq package-archives '(("gnu" . "https://mirrors.tuna.tsinghua.edu.cn/elpa/gnu/") ("nongnu" . "https://mirrors.tuna.tsinghua.edu.cn/elpa/nongnu/") ("melpa" . "https://mirrors.tuna.tsinghua.edu.cn/elpa/melpa/"))) (package-initialize) ;; You might already have this line (provide 'package-conf)这里我使用清华源，各位读者可以选择自己喜欢的源。上面的代码我们使用 package-enable-at-startup 来控制Emacs是否自动初始化package包管理器。这里为了更灵活我们禁止它自动初始化，改由手动初始化。我们可以在代码中使用类似于 (package-install 'package-name) 的方式来自动安装包，但是这里介绍更加高级的包管理器——use-package。如果使用Emacs原生的包管理器，那么就是先安装，然后想办法组织包配置的代码，这样将安装与配置分散起来了，不利于管理。使用use-package 可以方便的将它们组织起来。本质上use-package 提供了一系列的宏将包的安装和包的配置组合到一起，方便维护。而且它还提供了一些高级的特性方便我们灵活的控制各种配置生效的时间。我们可以使用如下语句进行安装;; package-conf.el (unless (package-installed-p 'use-package) (package-refresh-contents) (package-install 'use-package))它的基本语法如下:(use-package package-name :keyword1 value1 :keyword2 value2 ...)它的常用关键字如下::ensure: 确保包已安装。如果包未安装，use-package 会自动安装它，一般使用Emacs自带的包这里设置成nil，安装第三方的包，这里设置成t:init：在包加载之前执行的代码:config: 在包加载之后执行的代码:bind: 为包中的函数绑定快捷键:mode: 为特定文件类型启用包:hook: 在特定模式下启用包:defer: 延迟加载包，直到首次使用包:custom: 设置包的变量除了这些我们可以使用 :if 或 :when 关键字实现更复杂的条件加载。或者通过 :requires 关键字来指定包的依赖项配置主题说了这么多，我们使用 use-package 来安装一个主题来提高一下Emacs的颜值。这里我选用 doom-themes 包中的 doom-dracula 主题。关于ui部分的配置，我们都放在 ~/.emacs.d/lisp/init-ui.el 中;; init-ui.el (use-package doom-themes :ensure t :config (load-theme 'doom-dracula t)) (provide 'init-ui)我们在init.el 中加载init-ui之后,再次打开效果如下:设置字体我们在介绍文本属性的时候使用过face这个属性，Emacs中跟文字显示相关的属性都是face，它包括：字体、字号、颜色、背景。我们之前介绍了一系列的函数来处理字体字号，但是之前介绍的只能绑定到具体的文字上，默认的字体字号使用那些函数是无法设置的。我们可以使用 set-face-attribute 来设置字体属性。该函数的定义如下(set-face-attribute FACE FRAME &rest ARGS)参数face 表示设置的是哪个部分的字体属性，例如 default(默认字体) 、mode-line (状态栏字体)、region (选中区域字体)等。我们可以使用 M-x list-faces-display 来查看支持的face参数 frame 表示需要设置哪个窗口框架（通常用 nil 表示当前窗口或所有窗口）的字体属性。参数 ARGS 来设置具体的字体属性。以下属性可用于控制字体和样式：属性名功能描述示例值:family字体名称（需系统已安装）"Fira Code", "Consolas":height字号（以百分比或绝对点数表示，默认 100 = 10pt）120（12pt）, 14（14pt）:weight字重（如正常、加粗）'normal, 'bold:slant字体倾斜'normal, 'italic:width字体宽度（如压缩或扩展）'normal, 'condensed:underline下划线样式nil（无）, t（实线）:foreground前景色（文本颜色）"#FFFFFF", "red":background背景色"#333333":inherit继承其他 FACE 的属性'fixed-pitch这里我打算使用 Source Code Pro 字体，可以在init-ui.el 中这么设置(set-face-attribute 'default nil :family "Source Code Pro" :height 120)到此为止我们已经给Emacs做了基本的美化，日常使用也不那么碍眼了。
- 2025年03月17日
- 18 阅读
- 0 评论
- 0 点赞
2025-03-16
Emacs 折腾日记(十七)——文本属性我们在上一篇中介绍了如何对文件中的文本进行操作，本篇主要来介绍关于文本的属性。是的，文本也有属性。这里的文本属性有点类似于Word中的文字属性，文本中对应的字符只是文本属性的一种，它还包括文本大小、字体、颜色等等内容。Emacs中的文本也是类似的。于符号的属性类似，文本的属性也是由键值对构成。名字和值都可以是一个 lisp 对象，但是通常名字都是一个符号，这样可以用这个符号来查找相应的属性值。复制文本通常都会复制相应的字符的文本属性，但是也可以用相应的函数只复制文本字符串，比如 substring-no-properties、 insert-buffer-substring-no-properties、buffer-substring-no-properties。产生一个带属性的字符串可以用 propertize 函数。(propertize "abc" 'face 'bold) ;; ⇒ #("abc" 0 3 (face bold))这里我们使用 face 来设置它的字体为粗体。或者我们可以使用C-x C-f 任意的打开或者创建一个文本文件，在文件中输入(insert (propertize "abc" 'face 'bold))我们可以看到它会在当前光标后面插入一个粗体的 abc 字符串。需要注意的是，我们在*scratch* buffer 中是无法看到这个效果的。因为*scratch* buffer 中开启了font-lock-mode。正如它的名字表示的那样，它锁定了字体，它里面的字体属性都是实时计算出来的。在插入文本之后它的属性很快就被修改了。因为*scratch* buffer 本质上还是一个elisp的编程环境，它里面有关于elisp的语法高亮、自动对齐等特性。它会自动的修改输入的文本属性。我们可以使用 (font-lock-mode - 1) 来关闭这个mode，然后执行上述代码就可以看到具体的效果了。虽然文本属性的名字可以是任意的，但是一些名字是有特殊含义的。属性名含义category值必须是一个符号，这个符号的属性将作为这个字符的属性face控制文本的字体和颜色font-lock-face和 face 相似，可以作为 font-lock-mode 中静态文本的 facemouse-face当鼠标停在文本上时的文本 facefontified记录是否使用 font lock 标记了 facedisplay改变文本的显示方式，比如高、低、长短、宽窄，或者用图片代替help-echo鼠标停在文本上时显示的文字keymap光标或者鼠标在文本上时使用的按键映射local-map和 keymap 类似，通常只使用 keymapsyntax-table字符的语法表read-only不能修改文本，通过 stickness 来选择可插入的位置invisible不显示在屏幕上intangible把文本作为一个整体，光标不能进入field一个特殊标记，有相应的函数可以操作带这个标记的文本cursor（不知道具体用途）pointer修改鼠标停在文本上时的图像line-spacing新的一行的距离line-height本行的高度modification-hooks修改这个字符时调用的函数insert-in-front-hooks与 modification-hooks 相似，在字符前插入调用的函数insert-behind-hooks与 modification-hooks 相似，在字符后插入调用的函数point-entered当光标进入时调用的函数point-left当光标离开时调用的函数composition将多个字符显示为一个字形这些东西我觉得也不需要记住，在需要的时候查查文档就好了。但是我参考的教程把它列出来了，那么我也在这里列出来把。由于字符串和缓冲区都可以有文本属性（如果没有特别指定文本对象的属性，那么默认使用缓冲区定义的文本属性），所以下面的函数通常不提供特定参数就是检查当前缓冲区的文本属性，如果提供文本对象，则是操作对应的文本属性。查看文本属性查看文本对象在某处的文本属性可以用 get-text-property 函数。(setq foo (propertize "abc" 'face 'bold)) ;; ⇒ #("abc" 0 3 (face bold)) (get-text-property 0 'face foo) ;; ⇒ bold这里有两个问题需要注意一下，首先我们使用 propertize 为abc设置了文本属性face的值为bold，也就是将字符串设置为粗体。但是其中的0 和 3 代表什么呢？这里的0和3代表的是采用这个属性的字符在字符串中的范围，上面的代码中，整个abc字符串都采用整个属性，所以它的范围是[0, 3) 这个区间。要验证这一点我们可以使用下列代码(setq foo (concat "abc" (propertize "cde" 'face 'bold))) ;; ⇒ #("abccde" 3 6 (face bold)) (insert foo) 我们插入foo发现，它会插入 "abccde" 这么几个字符串，但是只有 "cde" 三个是加粗的根据这个提示，很明显的，get-text-property 中输入的0代表的就是“abc”字符串第0个，也就是字符a的属性。get-char-property 和 get-text-property 相似，但是它是先查找 overlay 的文本属性。overlay 是缓冲区文字在屏幕上的显示方式，它属于某个缓冲区，具有起点和终点，也具有文本属性，可以修改缓冲区对应区域上文本的显示方式。get-text-property 是查找某个属性的值，用 text-properties-at 可以得到某个位置上文本的所有属性。修改文本属性put-text-property 可以给文本对象添加一个属性。它也是需要传入一个范围值，例如我们在前面foo的基础上使用以下代码(put-text-property 0 3 'face 'italic foo)我们再针对 foo 执行插入操作，此时会发现 abc 这个子串变成斜体了。和 put-text-property 类似，add-text-properties 可以给文本对象添加一系列的属性。和 add-text-properties 不同，可以用 set-text-properties 直接设置文本属性列表。你可以用 (set-text-properties start end nil) 来除去某个区间上的文本属性。也可以用 remove-text-properties 和 remove-list-of-text-properties 来除去某个区域的指定文本属性。这两个函数的属性列表参数只有名字起作用，值是被忽略的。以下的例子还是建立在之前的 foo 变量之上，此时它的值为 #("baccde" 0 3 (face italic) 3 6 (face bold))。也就是前三个字符是斜体，后三个是加粗(set-text-properties 0 1 nil foo) ;; 取消了 a 字符的文本属性 foo ;; ⇒ #("abccde" 1 3 (face italic) 3 6 (face bold)) (remove-text-properties 2 4 '(face nil) foo) foo ;; ⇒ #("abccde" 1 2 (face italic) 4 6 (face bold)) (remove-list-of-text-properties 4 6 '(face nil) foo) foo ;; ⇒ #("abccde" 1 2 (face italic))查找文本属性文本属性通常都是连成一个区域的，所以查找文本属性的函数是查找属性变化的位置。这些函数一般都不作移动，只是返回查找到的位置。使用这些函数时最好使用 LIMIT 参数，这样可以提高效率，因为有时一个属性直到缓冲区末尾也没有变化，在这些文本中可能就是多余的。next-property-change 查找从当前位置起任意一个文本属性发生改变的位置。 next-single-property-change 查找指定的一个文本属性改变的位置。 next-char-property-change 把 overlay 的文本属性考虑在内查找属性发生改变的位置。next-single-property-change 类似的查找指定的一个考虑 overlay 后文本属性改变的位置。这四个函数都对应有 previous- 开头的函数，用于查找当前位置之前文本属性改变的位置(setq foo (concat "abc" (propertize "edf" 'face 'bold) (propertize "hij" 'pointer 'hand))) ;; ⇒ #("abcdefhji" 3 6 (face italic) 6 9 (face bold)) (next-property-change 1 foo) ;; ⇒ 3 (next-single-property-change 1 'pointer foo) ;; ⇒ 6text-property-any 查找区域内第一个指定属性值为给定值的字符位置。 text-property-not-all 和它相反，查找区域内第一个指定属性值不是给定值的字符位置。(text-property-any 0 9 'face 'bold foo) ;; ⇒ 3 (text-property-not-all 3 9 'face 'bold foo) ;; ⇒ 6
- 2025年03月16日
- 12 阅读
- 0 评论
- 0 点赞
2025-03-11
Emacs 折腾日记(十六)——文本操作作为一个文本编辑器，编辑文本是最基本，也是最重要的功能。本文将介绍关于文件操作的一系列操作，比如查找文件，读写文件，文件信息、读取目录、文件名操作等。在之前关于vim的介绍时，已经详细的介绍过关于文件、缓冲和窗口的关系。相信各位读者不会弄混这些概念。在emacs从硬盘上读取文件到缓冲并且显示的过程与vim类似。只是vim会根据后缀设置file type，并根据file type加载相关配置和代码。而emacs会加载各种mode和mode的配置。文件读写从硬盘读取一个文件可以使用快捷键 C-x C-f ，它对应的命令是 find-file。它的主要作用是从输入的路径中找到硬盘上存储的文件，并且从文件中读取内容到缓冲区，然后显示缓冲区到窗口。保存缓冲到文件可以使用 C-x C-s，它对应的命令是 save-buffer。它会将当前缓冲写入到指定的文件中。在打开文件的过程中，会调用 find-file-noselect，它是打开文件的核心操作，与 find-file 不同，它只返回访问文件的缓冲区。这两个函数都有一个特点，如果 emacs 里已经有一个缓冲区访问这个文件的话，emacs 不会创建另一个缓冲区来访问文件，而只是简单返回或者转到这个缓冲区。(find-file "~/.zshrc") ;; ==> #<buffer .zshrc> ;; 等效与 find-file (progn (setq foo (find-file-noselect "~/.zshrc")) (set-window-buffer nil foo))如何判断一个缓冲区是否关联了一个文件呢？每个和文件关联的缓冲区都有一个对应的 buffer-local 变量 buffer-file-name。但是不要直接设置这个变量来改变缓冲区关联的文件。而是使用 set-visited-file-name 来修改。同样不要直接从 buffer-list 里搜索buffer-file-name 来查找和某个文件关联的缓冲区。应该使用get-file-buffer 或者 find-buffer-visiting(setq foo (find-file-noselect "~/.zshrc")) (buffer-file-name foo) ;; ==> "home/xxx/.zshrc" (get-file-buffer "~/.zshrc") ;; ==> #<buffer .zshrc> (find-buffer-visiting "~/.zshrc") ;; ==> #<buffer .zshrc在打开文件过程中会调用 find-file-hook。这里的hook有点像vim中的事件，之前聊到过vim的自动命令，自动命令需要绑定到事件上触发。emacs中有大量的hook，我们通过在hook中添加一些操作来达到这个修改emacs默认行为或者增加新行为的特性。这个我们在后面再说。另外保存文件会调用一些hook和函数，保存文件之前会调用 before-save-hook,保存之后会调用 after-save-hook。一般来说，在配置emacs的时候，如果需要使用这些函数来读取文件，一般是读取上次退出时保存的临时文件，例如保存工程窗口布局的session文件。这些我们希望读取完成之后不将它们保留到buffer中。这个需求使用 find-file-noselect 是做不到的。必须使用更底层的函数。可以使用 insert-file-contents 和 write-region(insert-file-contents filename &optional visit beg end replace) (write-region start end filename &optional append visit lockname mustbenew)insert-file-contents 可以插入文件中指定部分到当前缓冲区中。如果指定 visit 则会标记缓冲区的修改状态并关联缓冲区到文件，一般是不用的。 replace 是指是否要删除缓冲区里其它内容，这比先删除缓冲区其它内容后插入文件内容要快一些，但是一般也用不上。insert-file-contents 会处理文件的编码，如果不需要解码文件的话，可以用 insert-file-contents-literally。write-region 可以把缓冲区中的一部分写入到指定文件中。如果指定 append 则是添加到文件末尾。和 insert-file-contents 相似，visit 参数也会把缓冲区和文件关联，lockname 则是文件锁定的名字，mustbenew 确保文件存在时会要求用户确认操作文件信息文件是否存在可以使用 file-exists-p 来判断。对于目录和一般文件都可以用这个函数进行判断，但是符号链接只有当目标文件存在时才返回 t。如何判断文件是否可读或者可写呢？file-readable-p、file-writable-p， file-executable-p 分用来测试用户对文件的权限。文件的位模式还可以用 file-modes 函数得到(file-readable-p "~/.zshrc") ;; ==>t (file-writable-p "~/.zshrc") ;; ==>t (file-executable-p "~/.zshrc") ;; ==>nil (file-modes "~/.zshrc") ;; ==> 420文件类型判断可以使用 file-regular-p、file-directory-p、file-symlink-p，分别判断一个文件名是否是一个普通文件（不是目录，命名管道、终端或者其它 IO 设备）、文件名是否一个存在的目录、文件名是否是一个符号链接。其中 file-symlink-p 当文件名是一个符号链接时会返回目标文件名。文件的真实名字也就是除去相对链接和符号链接后得到的文件名可以用 file-truename 得到。事实上每个和文件关联的 buffer 里也有一个缓冲区局部变量 buffer-file-truename 来记录这个文件名。文件更详细的信息可以用 file-attributes 函数得到。这个函数类似系统的 stat 命令，返回文件几乎所有的信息，包括文件类型，用户和组用户，访问日期、修改日期、status change 日期、文件大小、文件位模式、inode number、 system number临时文件如果要产生一个临时文件，可以使用 make-temp-file 这个函数按给定前缀产生一个不和现有文件冲突的文件，并返回它的文件名。如果给定的名字是一个相对文件名，则产生的文件名会用 temporary-file-directory 进行扩展。也可以用这个函数产生一个临时文件夹。如果只想产生一个不存在的文件名，可以用 make-temp-name 函数(make-temp-file "foo") (make-temp-name "foo")读取目录内容可以用 directory-files 来得到某个目录中的全部或者符合某个正则表达式的文件名。;; 获取用户目录的文件名称 (directory-files "~/") ;; 获取用户目录的文件全路径 (directory-files "~/") ;; 获取目录中所有cpp文件 (directory-files "~/demo/src" t "\\.cpp$")另外也可以写一段简单的代码来遍历某个路劲下所有文件(defun my-list-files (dir) "递归遍历目录 DIR 下的所有文件并返回路径列表。" (let ((files (directory-files dir t "^[^.]")) (result '())) (dolist (file files result) (if (file-regular-p file) (push file result) (when (and (file-directory-p file) (not (file-symlink-p file)) (file-readable-p file)) (setq result (append result (my-list-files file)))))))) (my-list-files "~/.emacs.d")在调用 directory-files 的时候通过一个正则表达式过滤掉所有以.开头的文件，这里主要是为了过滤掉 . 和 .. 防止进入无线递归。但是它也误伤了所有隐藏文件。后面就是比较常规的操作了，遍历返回的list，如果是文件则加入到现有结果集中，如果是目录则进入递归。directory-files-and-attributes 和 directory-files 相似，但是返回的列表中包含了 file-attributes 得到的信息。file-name-all-versions 用于得到某个文件在目录中的所有版本，file-expand-wildcards 可以用通配符来得到目录中的文件列表。修改文件信息重命名和复制文件可以用 rename-file 和 copy-file。删除文件使用 delete-file。创建目录使用 make-directory 函数。不能用 delete-file 删除目录，只能用 delete-directory 删除目录。当目录不为空时会产生一个错误。设置文件修改时间使用 set-file-times。设置文件位模式可以用 set-file-modes 函数。set-file-modes 函数的参数必须是一个整数。你可以用位函数 logand、logior 和 logxor 函数来进行位操作。(set-file-modes FILENAME MODE &optional FLAG)其中mode是数字，数字的含义与与chmode 命令类似，例如下面的调用(set-file-modes "example.txt" #o740)
- 2025年03月11日
- 8 阅读
- 0 评论
- 0 点赞
2025-03-07
Emacs 折腾日记(十五)——窗口在上一节提到，当前buffer不一定是当前显示在屏幕上的那个buffer，想要修改显示的buffer，可以使用窗口相关的api。这节来介绍一些窗口的操作。窗口是屏幕上用于显示一个缓冲区的部分。和它要区分开来的一个概念是 frame。frame 是 Emacs 能够使用屏幕的部分。可以用窗口的观点来看 frame 和窗口，一个 frame 里可以容纳多个（至少一个）窗口，而 Emacs 可以有多个 frame。不知道各位读者是否学习过MFC或者QT，这里的窗口就是MFC中的View，而frame则是整个界面框架，包括菜单栏工具栏、标题栏、状态栏等等部分。而窗口仅仅是最中间显示buffer的那一部分。分割窗口刚启动时，emacs 都是只有一个 frame 一个窗口。多个窗口都是用分割窗口的函数生成的。分割窗口的内建函数是split-window。这个函数的参数如下：(split-window &optional window size horizontal)这个函数的功能是把当前或者指定窗口进行分割，默认分割方式是水平分割，可以将参数中的 horizontal 设置为 non-nil 的值，变成垂直分割。如果不指定大小，则分割后两个窗口的大小是一样的。分割后的两个窗口里的缓冲区是同一个缓冲区。使用这个函数后，光标仍然在原窗口，而返回的新窗口对象：(split-window) ;; ==> #<window 7 on *scratch*>根据前面对于 optional 后参数的介绍，要填入 horizontal 的值实现竖直切分，需要填充前面的几个参数，如果不给则默认是nil。实际上上面的代码传入的可选参数都是nil，那么我们可以进行如下调用实现竖直分割窗口：(split-window nil nil 1) ;; ==> #<window 10 on *scratch*>我们也可以使用 selected-window 来获取当前选中的窗口，当前选中的窗口就是光标所在的窗口(split-window (selected-window) nil 1) ;; ==> #<window 11 on *scratch*>在进行实验的时候发现，分割的时候是在当前窗口的基础之上分割的，它是类似于这样的一个过程，它只在Win1所在的窗口区域进行划分，除非改变当前窗口。 +---------------+ +---------------+ | | | | | | win1 | | win1 | win2 | | | --> | | | | | | | | | | | | | +---------------+ +---------------+ | v +---------------+ +---------------+ | 4 | 5 | | | | | | | | win2 | | win1 | win2 | |--------| | <-- |-------| | | win3 | | | win3 | | | | | | | | +---------------+ +---------------+可以看成是这样一种结构(win1) -> (win1 win2) -> ((win1 win3) win2) -> (((win4 win5) win3) win2)删除窗口如果要让一个窗口不显示在屏幕上，要使用 delete-window 函数。如果没有指定参数，删除的窗口是当前选中的窗口，如果指定了参数，删除的是这个参数对应的窗口。删除的窗口多出来的空间会自动加到它的邻接的窗口中。如果要删除除了当前窗口之外的窗口，可以用 delete-other-windows 函数。当一个窗口不可见之后，这个窗口对象也就消失了(setq foo (selected-window)) (delete-window foo) (windowp foo) ;; ==> t (window-live-p foo) ;; ==> nil (delete-other-windows foo) ;; ==> error, 因为先删除foo所对应的窗口，现在已经无法找到这个窗口了，所以这里删除它以外的会报错窗口配置窗口配置(window configuration) 包含了 frame 中所有窗口的位置信息：窗口大小，显示的缓冲区，缓冲区中光标的位置和 mark，还有 fringe，滚动条等等。用 current-window-configuration 得到当前窗口配置，用 set-window-configuration 来还原。(setq foo (selected-window)) (split-window foo nil t) (split-window) (setq wc (current-window-configuration)) (delete-other-windows foo) (set-window-configuration wc)我们一行一行的执行上述代码，会发现调用 delete-other-windows 删除之前的窗口之后再次调用 set-window-configuration 会恢复上次保存的结果。看到这里各位读者是否有这么一个想法：利用这两个函数实现一个自动保存和恢复窗口结构的功能呢？但是经过测试，current-window-configuration 得到的对象并不能持久化的保存的到文件中，即使写到文件中，读取的时候也会报错。下面是我的测试代码(setq workspace-file-path "~/.session") ;; 保存窗口的配置 (defun my/save-current-workspace () (with-temp-file workspace-file-path (print (current-window-configuration) (current-buffer)))) ;; 加载窗口的配置 (defun my/load-current-workspace () (when (file-exists-p workspace-file-path) (with-temp-buffer (insert-file-contents workspace-file-path) (set-window-configuration (read (current-buffer))))))在执行保存之后，我们查看文件得到的是一个类似于 #<window-configuration> 的字符串，并没有别的内容，在调用 set-window-configuration的时候会报错。选择窗口前面提到过可以使用 selected-window 来获取当前光标所在的窗口。我们可以使用 select-window 来选择某个窗口作为当前窗口。使用 other-window 来选择另外的窗口。该函数是一个在不同窗口之间快速跳转的一个函数，它按照窗口创建的时间的逆序进行排序，根据传入的整数参数来决定跳转到第几个窗口。(progn (setq foo (selected-window)) (message "Original window: %S" foo) (other-window 1) (message "Current window: %S" (selected-window)) (select-window foo) (message "Back to original window: %S" foo))这里有两个特殊的宏 save-selected-window 和 with-selected-window。它的作用是在执行语句之后，选择的窗口回到之前选择的窗口。with-selected-window 和 save-selected-window 几乎相同，只不过 save-selected-window 选择了其它窗口。这两个宏不会保存窗口的位置信息，如果执行语句结束后，保存的窗口已经消失，则会选择最后一个选择的窗口(save-selected-window (select-window (next-window)) (goto-char (point-min)))上述代码会选择另一个窗口并将光标移动到缓冲的开始位置。当前 frame 里所有的窗口可以用 window-list 函数得到。可以用 next-window 来得到在 window-list 里排在某个 window 之后的窗口。对应的用 previous-window 得到排在某个 window 之前的窗口walk-windows 可以遍历窗口，相当于 (mapc proc (window-list))。 get-window-with-predicate 用于查找符合某个条件的窗口窗口大小信息窗口是一个长方形区域，所以窗口的大小信息包括它的高度和宽度。用来度量窗口大小的单位都是以字符数来表示，所以窗口高度为 45 指的是这个窗口可以容纳 45 行字符，宽度为 140 是指窗口一行可以显示 140 个字符mode line 和 header line 都包含在窗口的高度里，所以有 window-height 和 window-body-height 两个函数，后者返回把 mode-line 和 header line 排除后的高度(window-body-height) ;; ==> 53 (window-height) ;; ==> 54滚动条和 fringe 不包括在窗口的亮度里，window-width 返回窗口的宽度。所以 window-body-width 和 window-width 返回的结果一样(window-body-width) ;; ==> 234 (window-width) ;; ==> 234也可以用 window-edges 返回各个顶点的坐标信息。window-edges 返回的区域包含了滚动条、fringe、mode line、header line 在内，如果单纯的想要返回文本所在区域可以使用 window-inside-edges(window-edges);; ==> (0 0 238 54) (window-inside-edges) ;; ==> (1 0 236 54) 如果需要的话也可以得到用像素表示的窗口位置信息,这里用到的函数是 window-pixel-edges 和 window-inside-pixel-edges(window-pixel-edges) ;; ==> (0 0 1908 922) (window-inside-pixel-edges) ;; ==> (8 0 1884 905)到目前为止，我们有了手段可以遍历窗口以及获取窗口的坐标，那么利用这些数据就可以做到记录和恢复之前的窗口布局了。我最开始的思路是采用 walk-windows 来遍历窗口，并且使用 window-pixel-edges 来记录每个窗口的区域。但是这么做有一些问题无法解决：首先还原的时候创建窗口只能采用 split-window，而 split-window 是基于之前的窗口来创建的，walk-windows 无法反映出这种层级关系。另外就是emacs 中没有函数来设置窗口左上角的坐标，我们只能通过函数来改变窗口的宽和高，窗口的位置在使用 split-window 创建的时候已经决定了。所以我们需要一种能表示层级关系的结构来存储窗口的信息。这个时候就要引入 window-tree 函数了。这个函数可以返回当前 frame 窗口布局的树状结构。为了说明它的返回值，我们先来举一个例子。首先打开emacs，此时看到只有一个窗口，暂时叫它窗口A在窗口上垂直分割一个窗口，新生成的窗口叫做窗口B，此时左侧的窗口是A，右侧的是B在B窗口上水平分割一个窗口，生成一个新的C窗口此时应该有3个窗口，它们的布局如下:+---------------+ | | | | A | B | | |-------| | | C | | | | +---------------+如果用树来表示这个布局，可以组成这么一颗树 frame / \ left right (win A) / \ / \ top bottom win B win C对于叶子节点来说，window-tree 返回的数据形式是 (DIR EDGES CHILD1 CHILD2 ...) 各部分代表的含义如下:DIR，表示分割类型，t表示竖直分割，nil表示水平分割EDGES，表示窗口区域的坐标，格式为 (LEFT TOP RIGHT BOTTOM)，以字符为单位CHILDREN, 子节点列表，可以是分支节点或叶子节点而叶子节点是一个窗口对象。上面的窗口布局，使用 window-tree 得到的结果如下( (nil (0 0 84 35) #<window 3 on *scratch*> (t (42 0 84 35) #<window 7 on *scratch*> #<window 9 on *scratch*>)) #<window 4 on *Minibuf-0*>)去除掉minibuffer部分，着重分析一下文本区域的分割(nil (0 0 84 35) #<window 3 on *scratch*> (t (42 0 84 35) #<window 7 on *scratch*> #<window 9 on *scratch*>))首先水平分割，占区域大小为 (0 0 84 35)。此时上面一个部分是 win3。下半部分右进行了分割。下半部分采用竖直方式进行分割，占区域为 (42 0 84 35)。这个部分有两个子窗口win7 和 win9。感觉分割的顺序与我们的直觉相悖。但是仔细想想好像又能产生之前那种结果 (42 0) +---------------+ | | | | win3 | win7 | | |-------| | | win9 | | | | +---------------+ (84 35)我们可以写下如下代码来进行这个结构的解析(defun my-current-window-configuration () ;; pai chu minibuffer de shu ju (my-window-tree-to-list (car (window-tree)))) (defun my-window-tree-to-list (tree) (if (windowp tree) 'win (let ((dir (car tree)) (children (cddr tree))) (list (if dir 'vertical 'horizontal) (if dir (my-window-height (car children)) (my-window-width (car children))) (my-window-tree-to-list (car children)) (if (> (length children) 2) (my-window-tree-to-list (cons dir (cons nil (cdr children)))) (my-window-tree-to-list (cadr children))))))) (defun my-window-height (win) (if (windowp win) (window-height win) (let ((edge (cadr win))) (- (nth 3 edge) (nth 1 edge))))) (defun my-window-width (win) (if (windowp win) (window-width win) (let (edge (cadr win)) (- (nth 2 edge) (car edge)))))根据这个结构编写一个还原的功能(defun my-list-to-window-tree (conf) (when (listp conf) (let (newwin) (setq newwin (split-window nil (cadr conf) (eq (car conf) 'horizontal))) (my-list-to-window-tree (nth 2 conf)) (select-window newwin) (my-list-to-window-tree (nth 3 conf))))) (defun my-set-window-configuration (winconf) (delete-other-windows) (my-list-to-window-tree winconf))可以使用如下代码进行调用(setq foo (my-current-window-configuration)) ;; do something (my-set-window-configuration foo)窗口对应的缓冲区窗口对应的缓冲区可以用 window-buffer 函数得到：(window-buffer) ;; ==> #<buffer *scratch*>缓冲区对应的窗口也可以用 get-buffer-window 得到。如果有多个窗口显示同一个缓冲区，那这个函数只能返回其中的一个，由window-list 决定。如果要得到所有的窗口，可以用 get-buffer-window-list(get-buffer-window (get-buffer "*scratch*")) (get-buffer-window-list (get-buffer "*scratch*"))让某个窗口显示某个缓冲区可以用 set-window-buffer 函数。让一个缓冲区可见可以用 display-buffer。默认的行为是当缓冲区已经显示在某个窗口中时，如果不是当前选中窗口，则返回那个窗口，如果是当前选中窗口，且如果传递的 not-this-window 参数为 non-nil 时，会新建一个窗口，显示缓冲区。如果没有任何窗口显示这个缓冲区，则新建一个窗口显示缓冲区，并返回这个窗口。display-buffer 是一个比较高级的命令，用户可以通过一些变量来改变这个命令的行为。比如控制显示的 pop-up-windows， display-buffer-reuse-frames，pop-up-frames，控制新建窗口高度的 split-height-threshold，even-window-heights，控制显示的 frame 的 special-display-buffer-names，special-display-regexps， special-display-function，控制是否应该显示在当前选中窗口 same-window-buffer-names，same-window-regexps 等等。这里的函数实在是太多了，我想暂时不用都记住，现在又有各种大模型，到时候有需求直接使用问就行。或者记住这一个函数，后面要扩展自己去查文档
- 2025年03月07日
- 4 阅读
- 0 评论
- 0 点赞
2025-02-21
Emacs折腾日记(十四)——buffer操作教程中的下一节应该是正则表达式。但是我觉得目前来说正则表达式对我来说不是重点，而且正则表达式我还是比较了解，没必要专门去学习，在使用的时候看看相应的章节就好。况且现在有AI这个利器，在处理正则表达式应该问题不大。所以这里就略过这节，直接进入后面的学习截止到前面的一些文章，我觉得应该已经涉及到了emacs lisp中的语法要点，现在去看一些emacs配置中的代码不太会一头雾水了。离攒自己的配置又进了一步。期间我想过是不是可以跳过教程后面的内容直接进入配置的过程呢？仔细考虑了一下，我觉得还是有必要跟着教程深入了解一下操作emacs对象的一些API。就像我之前学习C/C++编程一样，如果只学语法部分，最多也就能写写基于链表等数据结构的黑框框的信息管理系统。如果想要写点带界面的或者带网络功能的或者稍微复杂点的程序就离不开操作系统，网络编程，数据库等等知识。emacs的学习可能也是这样，现在也只能写点算术运算或者say-hello 这样的玩具。想要跟emacs结合起来，真正流畅的操作emacs，还需要学一些emacs自身的知识。缓冲区名称在学习vim的时候已经很详细的了解过什么是缓冲区，以及缓冲区与文件有什么区别。在这里我想就没有必要再谈论了，如果有读者不太清楚这方面的内容，欢迎阅读我博客中关于vim缓冲区的部分。emacs中缓冲区的概念与vim基本没什么区别。唯一的区别可能是emacs中一些内置的缓冲区与vim的不太一样。emacs 里的所有缓冲区都有一个不重复的名字。所以和缓冲区相关的函数通常都是可以接受一个缓冲区对象或一个字符串作为缓冲区名查找对应的缓冲区。有一个习惯是名字以空格开头的缓冲区是临时的，用户不需要关心的缓冲区。所以现在一般显示缓冲区列表的命令都不会显示这样的变量，除非这个缓冲区关联一个文件。要得到缓冲区的名字，可以用 buffer-name 函数，它的参数是可选的，如果不指定参数，则返回当前缓冲区的名字，否则返回指定缓冲区的名字。更改一个缓冲区的名字用 rename-buffer，这是一个命令，所以你可以用 M-x 调用来修改当前缓冲区的名字。如果你指定的名字与现有的缓冲区冲突，则会产生一个错误，除非你使用第二个可选参数以产生一个不相同的名字，通常是在名字后加上 <序号> 的方式使名字变得不同。你也可以用 generate-new-buffer-name 来产生一个唯一的缓冲区名。它需要传入一个参数，表示buffer的名称，如果当前buffer有名称与指定名称冲突，它会在你提供的名称后面加一些后缀，否则就采用传入的名称;; scratch buffer 中 (buffer-name) ;; ==> *scratch* ;; 此时 *scratch* 已经被重命名成了 scratch (rename-buffer (generate-new-buffer-name "scratch")) ;; ==> scratch当前缓冲区可以使用 current-buffer 来获取当前缓冲区，需要注意的是当前缓冲区不一定是显示在当前屏幕上的那个缓冲区。这个跟工作目录有点像，当前目录并不一定就是程序所在的目录或者当前打开的文件所在的目录。我们可以使用 set-buffer 来设置当前缓冲区，但是前面我们说过当前缓冲区并不一定是显示在屏幕上的那个缓冲区，即使修改当前缓冲区，也不会改变当前窗口上显示的缓冲区(set-buffer "*Messages*") ;; ==> #<buffer *Messages*>，但是屏幕上显示的缓冲区没有变化如果要切换当前屏幕显示的缓冲区需要配置窗口相关的函数，例如我们可以使用 switch-to-buffer(switch-to-buffer "*Messages*")前面提到 set-buffer 可以改变当前缓冲区，但是我们调用 buffer-name 获取当前缓冲区的名称时得到还是 scratch buffer(set-buffer "*Messages*") ;; ==> #<buffer *Messages*> (buffer-name) ;; ==> #<buffer *scratch*> (buffer-name) ;; ==> "*scratch*"这是因为我们如果采用 C-x C-e 来分别执行，这就相当于在命令行执行命令一样，每次语句结束之后，emacs会重新刷新上下文环境。而 buffer-name获取的是当前上下文环境中的当前缓冲区名称。上下文环境随着上一条语句的结束而更新，这就导致了当前缓冲区变化。这个过程可以描述为如下的过程[主进程环境] │ ├── [逐行执行L1] → 创建临时子环境 → 执行set-buffer → 销毁子环境 └── [逐行执行L2] → 创建新子环境 → 读取buffer-name → 返回主环境值所以如果要得到正确的结果，就是一次性执行完这两条语句，按照我当前的知识储备有三种办法：第一个办法就是使用 eval-buffer，从messages buffer 中获取输出信息第二个办法，使用 progn 将两条语句包含起来第三个办法就是将它包装成一个函数或者宏来执行(progn (set-buffer "*Messages*") (buffer-name)) ;; ==> "*Messages*"但是我们不能仅仅依靠这种包裹代码的方式来实现切换buffer的效果。因为这个命令很可以会被另一个程序员来调用。你也不能直接用 set-buffer 设置成原来的缓冲区，因为set-buffer不能处理错误或退出情况。正确的作法是使用 save-current-buffer、with-current-buffer 和 save-excursion 等方法save-current-buffer 能保存当前缓冲区，执行其中的表达式，最后恢复为原来的缓冲区。如果原来的缓冲区被关闭了，则使用最后使用的那个当前缓冲区作为语句返回后的当前缓冲区。lisp 中很多以 with 开头的宏，这些宏通常是在不改变当前状态下，临时用另一个变量代替现有变量执行语句。比如 with-current-buffer 使用另一个缓冲区作为当前缓冲区，语句执行结束后恢复成执行之前的那个缓冲区save-excursion 与 save-current-buffer 不同之处在于，它不仅保存当前缓冲区，还保存了当前的位置和 mark。在 scratch 缓冲区中运行下面两个语句就能看出它们的差别了(save-current-buffer (set-buffer "*scratch*") (goto-char (point-min)) (save-excursion (set-buffer "*scratch*") (goto-char (point-min))上面两段代码，都是先保存当前缓冲区，然后使用 set-buffer 保证当前缓冲区是 scratch buffer，接着调用goto-char移动鼠标光标到buffer最开始的位置。随着代码块的结束，会自动切换回对应的buffer。但是因为 save-excursion 会额外保存当前位置和 mark，所以我们发现第一段代码光标位置跑到缓冲区最开始的位置，而第二段代码光标位置不变在对比一下它们与 with-current-buffer 的区别，with-current-buffer 调用时已经帮我们使用 set-buffer设置好了当前缓冲区，而且也会保存当前缓冲区，在结束之后也会还原当前缓冲区。但是它使用的是 save-current-buffer。我们可以使用 C-h C-f 来查看并找到它的源代码(defmacro with-current-buffer (buffer-or-name &rest body) (declare (indent 1) (debug t)) `(save-current-buffer (set-buffer ,buffer-or-name) ,@body))我们发现它其实就是用 save-current-buffer 做了一次封装。如果我们对上面的测试代码稍加修改使用 with-current-buffer 实现，例如(with-current-buffer "*Messages*" (goto-char (point-min)))执行之后我们发现，它的光标位置也改变了。创建和关闭缓冲区产生一个缓冲区必须用给这个缓冲区一个名字，所以两个能产生新缓冲区的函数都是以一个字符串为参数：get-buffer-create 和 generate-new-buffer。这两个函数的差别在于前者如果给定名字的缓冲区已经存在，则返回这个缓冲区对象，否则新建一个缓冲区，名字为参数字符串，而后者在给定名字的缓冲区存在时，会使用加上后缀（N 是一个整数，从2开始）的名字创建新的缓冲区。(get-buffer-create "temp") (with-current-buffer "temp" (insert "this is temp buffer")) (switch-to-buffer "temp")上面的代码，我们先创建一个新的temp buffer，并且切换到这个buffer，然后在这个buffer中调用insert函数，插入一段话。最后可以让窗口显示这个buffer来验证结果关闭一个缓冲区可以用 kill-buffer。当关闭缓冲区时，如果要用户确认是否要关闭缓冲区，可以加到 kill-buffer-query-functions 里。如果要做一些善后处理，可以用 kill-buffer-hook。通常一个接受缓冲区作为参数的函数都需要参数所指定的缓冲区是存在的。如果要确认一个缓冲区是否依然还存在可以使用 buffer-live-p。要对所有缓冲区进行某个操作，可以用 buffer-list获得所有缓冲区的列表。如果你只是想使用一个临时的缓冲区，而不想先建一个缓冲区，使用结束后又需要关闭这个缓冲区，可以用 with-temp-buffer 这个宏。从这个宏的名字可以看出，它所做的事情是先新建一个临时缓冲区，并把这个缓冲区作为当前缓冲区，使用结束后，关闭这个缓冲区，并恢复之前的缓冲区为当前缓冲区。在缓冲区内移动在学会移动函数之前，先要理解两个概念：位置（position）和标记（mark）。位置是指某个字符在缓冲区内的下标，它从1开始。更准确的说位置是在两个字符之间，所以有在位置之前的字符和在位置之后的字符之说。但是通常我们说在某个位置的字符都是指在这个位置之后的字符。这点很符合我们的直觉，一般在编写代码或者文档的时候当前的光标就是在文本之间移动。标记和位置的区别在于位置会随文本插入和删除而改变位置。一个标记包含了缓冲区和位置两个信息。在插入和删除缓冲区里的文本时，所有的标记都会检查一遍，并重新设置位置。这对于含有大量标记的缓冲区处理是很花时间的，所以当你确认某个标记不用的话应该释放这个标记。创建一个标记使用函数 make-marker。这样产生的标记不会指向任何地方。你需要用 set-marker 命令来设置标记的位置和缓冲区。(setq foo (make-marker)) ; ==> #<marker in no buffer> (set-marker foo (point)) ; ==> #<marker at 195 in *scratch*>point 函数其实返回一个整数，表示当前光标在哪个位置，既然这里只用传入位置就可以正确的将foo这个标签绑定到对应的缓冲区，这里set-marker 应该是以当前缓冲区作为标签的缓冲区，我们可以使用下面的代码来验证(with-current-buffer "*Messages*" (set-marker foo (point))) ;; ==> #<marker at 477 in *Messages*>也可以用 point-marker 直接得到 point 处的标记。或者用 copy-marker 复制一个标记或者直接用位置生成一个标记(point-marker) ;; ==> #<marker at 211 in *scratch*> (copy-marker 20) ;; ==> #<marker at 20 in *scratch*> (copy-marker foo) ;; ==> #<marker at 195 in *scratch*>如果要得一个标记的内容，可以用 marker-position，marker-buffer(marker-position foo) ;; ==> 195 (marker-buffer foo) ;; ==> #<buffer *scratch*>位置就是一个整数，而标记在一般情况下都是以整数的形式使用，所以很多接受整数运算的函数也可以接受标记为参数。比如加减乘。(goto-char (+ (marker-position foo) 10)例如上面的代码我们移动光标到第205个字符的位置。和缓冲区相关的变量，有的可以用变量得到，比如缓冲区关联的文件名，有的只能用函数来得到，比如 point。point 是一个特殊的缓冲区位置，许多命令在这个位置进行文本插入。每个缓冲区都有一个 point 值，它总是比函数 point-min 大，比另一个函数 point-max 返回值小。注意，point-min 的返回值不一定是 1，point-max 的返回值也不定是比缓冲区大小函数 buffer-size 的返回值大 1 的数，因为 emacs 可以把一个缓冲区缩小（narrow）到一个区域，这时 point-min 和 point-max 返回值就是这个区域的起点和终点位置。所以要得到 point 的范围，只能用这两个函数，而不能用 1 和 buffer-size 函数。按单个字符位置来移动的函数主要使用 goto-char 和 forward-char、backward-char。前者是按缓冲区的绝对位置移动，而后者是按 point 的偏移位置移动比如(goto-char (point-min)) ; 跳到缓冲区开始位置 (forward-char 10) ; 向前移动 10 个字符 (forward-char -10) ; 向后移动 10 个字符 (backward-char 10) ; 向后移动 10 个字符 (backward-char -10) ; 向前移动 10 个字符按词移动使用 forward-word 和 backward-word。至于什么是词，这就要看语法表格的定义了。按行移动使用 forward-line。没有 backward-line。forward-line 每次移动都是移动到行首的。所以，如果要移动到当前行的行首，使用 (forward-line 0)。如果不想移动就得到行首和行尾的位置，可以用 line-beginning-position 和 line-end-position。得到当前行的行号可以用 line-number-at-pos。需要注意的是这个行号是从当前状态下的行号，如果使用 narrow-to-region 或者用 widen 之后都有可能改变行号。由于 point 只能在 point-min 和 point-max 之间，所以 point 位置测试有时是很重要的，特别是在循环条件测试里。常用的测试函数是 bobp（beginning of buffer predicate）和 eobp（end of buffer predicate）。对于行位置测试使用 bolp（beginning of line predicate）和 eolp（end of line predicate）缓冲区的内容要得到整个缓冲区的文本，可以用 buffer-string 函数。如果只要一个区间的文本，使用 buffer-substring 函数。point 附近的字符可以用 char-after 和 char-before 得到。point 处的词可以用 current-word 得到，其它类型的文本，比如符号，数字，S 表达式等等，可以用 thing-at-point 函数得到。ting-at-point 可以获取光标处的很多类型的内容，它需要传入一个符号作为类型，例如 'word、'symbol、'url。不同的类型包含有不同的文本属性，第二个参数表示是否去除文本属性。如果当前位置有内容，则返回内容，否则返回nil(defun show-current-word () (interactive) (let ((word (thing-at-point 'word t))) ;; 'word 类型，t 表示去除文本属性 (if word (message "当前单词: %s" word) (message "光标位置没有单词"))))修改缓冲区的内容要修改缓冲区的内容，最常见的就是插入、删除、查找、替换了。下面就分别介绍这几种操作。插入文本最常用的命令是 insert。它可以插入一个或者多个字符串到当前缓冲区的 point 后。也可以用 insert-char 插入单个字符。插入另一个缓冲区的一个区域使用 insert-buffer-substring。删除一个或多个字符使用 delete-char 或 delete-backward-char。删除一个区间使用 delete-region。如果既要删除一个区间又要得到这部分的内容使用 delete-and-extract-region，它返回包含被删除部分的字符串。最常用的查找函数是 re-search-forward 和 re-search-backward。这两个函数参数如下(re-search-forward REGEXP &optional BOUND NOERROR COUNT) (re-search-backward REGEXP &optional BOUND NOERROR COUNT)其中 BOUND 指定查找的范围，默认是 point-max（对于 re-search-forward）或 point-min（对于 re-search-backward），NOERROR 是当查找失败后是否要产生一个错误，一般来说在 elisp 里都是自己进行错误处理，所以这个一般设置为 t，这样在查找成功后返回区配的位置，失败后会返回 nil。COUNT 是指定查找匹配的次数。替换一般都是在查找之后进行，也是使用 replace-match 函数。和字符串的替换不同的是不需要指定替换的对象了。
- 2025年02月21日
- 21 阅读
- 0 评论
- 0 点赞
2025-02-19
Emacs折腾日记(十三)——函数、宏以及命令之前在开篇介绍简单的elisp时候就提到过函数，后面的一些示例中也用到了一些函数，但是都是一些基本的概念，这篇将深入了解函数的一些特性。首先要判断一个符号是否是函数，可以使用 functionp 来判断。(defun foo() 1) (foo) (functionp 'foo) ;; ==> t (setq var 1) (functionp 'var) ;; ==> nil不光函数，以下几种functionp也返回t函数。这里的函数特指用 lisp 写的函数。原子函数（primitive）。用 C 写的函数，比如 car、append。lambda 表达式特殊表达式宏(macro)。宏是用 lisp 写的一种结构，它可以把一种 lisp 表达式转换成等价的另一个表达式。命令。命令能用 command-execute 调用。函数也可以是命令。参数列表的语法过去我们的所有函数都是定参的函数，也就是说是确定了参数个数的函数。但是实际使用中会大量使用不定参函数，也就是参数不确定的函数。在C/C++ 以及 Python中会大量使用。它的一个使用场景就是某些时候不传就采用默认值，否则就采用用户定义的值。另一个场景就是像printf这样事先无法确定到底要输出多少内容。elisp中的函数完整定义如下(defun func (REQUIRED-VARS... [&optional OPTIONAL-VARS...] [&rest REST-VAR]))前面是确定的参数列表，也就是说前面的参数在调用函数时必须传入，而&optional 之后是可选参数，如果要传入可选参数这个 &optional 关键字是必须写上的。这里的可选参数也是需要在定义时一个个的指定出来，但是&rest 之后定义的只用一个变量来使用，在传入的时候可以传入任意个参数。例如下面的例子(defun foo (var1 var2 &optional op1 op2 &rest rest) (list var1 var2 op1 op2 rest)) (foo 1 2) ;; ==> (1 2 nil nil nil) (foo 1 2 3) ;; ==> (1 2 3 nil nil) (foo 1 2 3 4) ;; ==> (1 2 3 4 nil) (foo 1 2 3 4 5) ;; ==> (1 2 3 4 (5)) (foo 1 2 3 4 5 6) ;; ==> (1 2 3 4 (5 6))从这个例子我们可以得出以下几个结论：当可选参数没有提供时，在函数体里，对应的参数值都是 nil。我们可以通过判断是否为nil来判断用户是否传了参&rest 要捕获后面所有传入的参数，所以它必须在参数列表的最后面,它的值是一个list当 &rest 与 &optional 共存时，优先匹配 &optional 参数，最后如果有剩余的参数则分配给 &rest教程原文中是有关于文档字符串的描述的。但是我想现在我作为一个菜鸟，将来要组织自己的配置也主要依靠拷贝粘贴别人现有的东西再组合，没有多少机会参与那种高大上的开源项目，自己将来弄的配置估计也没什么人用，而且我也会详细记录自己攒配置的过程，所以这里就不需要给函数写过于详细的文档说明。这里我就跳过这块了。如果有读者对这块感兴趣可以看原文。函数调用在编写程序的时候会有这种需求，一个框架负责处理大块的内容，比如数据解析、转发等等，它会预留一些接口来让用户在此基础之上处理自己的业务逻辑，比较典型的就是http server，或者gui程序框架。在C/C++ 中一般会预留一些函数指针类型的参数进行回调或者提供接口供使用方重载实现自己的逻辑。在elisp中也有这样的操作，但是它就没有虚函数、虚基类或者函数指针的概念。在elisp中通过符号调用一个函数使用的方法是 funcall 和 apply。它们都是通过符号来调用函数的，唯一的区别在于如何处理传入参数。我们通过一个例子来看看它们有什么不同。我们还是用上面定义的foo函数来测试(funcall 'foo 1 2 3 4 5 6) ;; ==> (1 2 3 4 (5 6)) (apply 'foo 1 2 3 4 5 6) ;; ==> error (apply 'foo 1 2 3 4 '(5 6)) ;; ==> (1 2 3 4 (5 6)) (apply 'foo 1 2) ;; ==> error (apply 'foo '(1 2)) ;; ==> (1 2 nil nil nil) (apply 'foo 1 2 3 4) ;; ==> error (apply 'foo 1 2 '(3 4)) ;; ==> (1 2 3 4 nil) (apply 'foo 1 2 3 4 5) ;; ==> error (apply 'foo 1 2 3 4 '(5)) ;; ==> (1 2 3 4 (5))从上面的结果可以看出，funcall 直接按照对应函数定义的参数列表进行传参即可。而apply在传参的时候最后一个参数必须是list，并且在嗲用时会自动将list参数给展开并传入各个参数。从上面的区别可以看出，如果在调用函数的时候，参数已经通过list进行了组织的话，那么使用apply更为合适，否则使用funcall。宏宏是lisp家族中一个非常重要，也非常灵活的内容，可以说宏是lisp的灵魂。之前在看到一些lisp相关的教程时都说，宏实现了利用代码生成代码，并且因为宏的存在导致lisp中扩展出了大量的方言。可以说没有宏，lisp就不是lisp了，或者说lisp就没这么灵活了。但是C/C++中也有宏的概念，C/C++中的宏是在预处理阶段进行简单的文本替换，然后编译替换之后的结果。虽然利用宏，C/C++中可以实现很多非常复杂的功能，但是它远远没有lisp的宏灵活。要详细了解宏的相关内容，我们先回忆一下之前介绍的elisp的知识。首先elisp或者lisp的代码本身就是一颗语法树。它被写作一个list。也就是说list既可以作为代码执行，也可以作为数据，例如 (setq x 1) 它是一段代码。而 '(setq x 1) 它是一个列表，列表中有3个元素，分别是 setq 、x、1 这么三个符号和数字。再者elisp特有的符号系统，例如 x 表示一个变量，可以对它进行求值，'x 代表一个符号，根据前面所学的，我们可以通过符号找到符号中记录的值、函数、属性等等。基于这两个内容，我们可以通过操作list来实现生成一段代码。例如下列的例子(defun my-inc (var) (list 'setq var (list '1+ var))) (setq x 0) (eval (my-inc 'x)) ;; ==> 1上面的其实就是返回了一个list， (setq var (1+ var))。后面我们通过 eval 来执行这个返回的list。需要注意的时，函数调用时会首先将变量进行求值，然后将值作为参数传入，但是这里我们希望并不希望传入一个具体的值，而是希望他能操作我们传入的变量值，并改变它，要做到这点需要传入一个符号。这里有点像C++ 中的引用传递定义宏其实跟定义函数非常相似。我们只需要将关键字由 defun 改为 defmacro。(defmacro my-inc(var) (list 'setq var (list '1+ var))) (setq x 0) (my-inc x) ;; ==> 1我们发现宏与函数的一个不同点，函数中代码在函数被调用时执行，并且参数是在调用时进行求值并传入。而宏调用时需要展开它返回的表达式(或者这里直接就是一个list)。然后将参数作为符号传入。宏最后需要返回一段可执行的list数据，如果没有返回，会影响展开执行，最终可能会报错，例如下面的例子(defmacro my-inc (var) (setq var (1+ var))) (setq x 0) (my-inc x) ;; ==> error这里的问题在于这个宏定义的代码是一个直接执行的代码，并不是一个list，所以在调用它的时候会直接执行，但是又需要将参数作为符号绑定，所以它在被调用的时候会执行(setq 'x (1+ 'x)) 这段代码，而这里的x是一个符号，无法直接对符号进行赋值，所以它会报x的类型错误。这里已经显示出了，elisp中的宏与C/C++中宏的不同。首先C/C++中的宏只是简单的字符串替换，可以将它理解为它生成了新的C/C++源码的代码，它在预处理阶段来执行代码的替换。而elisp中并没有简单的进行替换，根据之前介绍lisp表达式的解析，其实宏返回的是一颗抽象语法树。在扩展宏的时候不断的进行抽象语法树的修改和重建，最后在执行的时候将传入的参数作为符号放入到这颗树中的对应节点。我们可以使用 macroexpand 来查看宏展开的样子。(defmacro bad-inc (var) (setq var (1+ var))) (macroexpand '(bad-inc 0)) ;; ==> 1我们发现之前错误的实现并没有生成可执行的代码，而是直接返回一个常数。因为宏中的代码首先在展开的时候就已经执行了。相当于返回了 setq var (1+ 0) 的值，也就是1。(defmacro my-inc (var) (list 'setq var (list '1+ var))) (macroexpand '(my-inc x)) ;; ==> (setq x (1+ x))使用 macroexpand 可以使宏的编写变得容易一些。但是如果不能进行 debug 是很不方便的。在宏定义里可以引入 declare 表达式，它可以增加一些信息。目前只支持两类声明：debug 和 indent。debug 可选择的类型很多，具体参考 info elisp - Edebug 一章，一般情况下用 t 就足够了。indent 的类型比较简单，它可以使用这样几种类型：nil 也就是一般的方式缩进defun 类似 def 的结构，把第二行作为主体，对主体里的表达式使用同样的缩进整数表示从第 n 个表达式后作为主体。比如 if 设置为 2，而 when 设置为 1符号这个是最坏情况，你要写一个函数自己处理缩进。从前面的例子就可以看到，如果在定义宏的时候使用list cons 等来构建list是非常麻烦的，一旦要构造非常复杂的程序，可能直接就歇菜了。为了方便，elisp中提供了一些符号来简化操作。 ` 读作backquote，表示被它包裹的表达式都是quote，可以理解为它里面的直接构建了一个list如果希望它里面的某个位置不作为quote的一部分，而是直接作为列表的元素，可以使用 , , 也就是它会对后面的内容进行求值如果要让一个列表作为整个列表的一部分（slice），可以用 ",@"，它会将后面的内容作为列表参数依次添加到当前列表中。我想起来了之前接触过的quote，也就是 ' 。它表示后面的内容不进行求值，作为符号，虽然它也可以构造一个list，但是二者还是有些不同，例如'(list x (+ 1 2)) ;; ==> (list x (+ 1 2)) `(list x (+ 1 2)) ;; ==> (list x (+ 1 2)) '(list x ,(+ 1 2)) ;; ==> (list x (\, (+ 1 2))) `(list x ,(+ 1 2)) ;; ==> (list x 3) (setq var '(2 3)) '(list x ,@var) ;; ==> (list x (\,@ var)) `(list x ,@var) ;; ==> (list x 2 3)我们使用上面的方法稍微弄一个复杂一点的宏(defmacro max(a b) `(if (> ,a ,b) ,a ,b)) (max 4 5) (max (1+ 2) (+ 3 6)) '(macroexpand '(max (1+ 2) (+ 3 6))) ;; ==> (if (> (1+ 2) (+ 3 6)) (1+ 2) (+ 3 6))这里是一个经典的C/C++ 中的max宏。虽然实现不严谨，有一些副作用，但是可以从上面看到一些用法。首先使用 ` 表示返回一个列表，以供调用的时候进行展开。再者对于传入的a和b需要使用, 来表示需要求解它们的值，实现参数的绑定，否则将会得到一个错误，例如(defmacro max(a b) `(if (> a b) a b)) (macroexpand '(max 4 5))) ;; ==> (if (> a b) a + b)如果将上述的 , 全部替换成 ,@ 就不太合适了，因为 ,@ 是将列表中的值取出来组成新的列表，并不会想 , 那样进行求值。例如(defmacro max(a b) `(if (> ,@a ,@b) ,@a ,@b)) (macroexpand '(max (1+ 2) (+ 3 6))) ;; ==> (if (> 1+ 2 + 3 6) 1+ 2 + 3 6)命令emacs 运行时就是处于一个命令循环中，不断从用户那得到按键序列，然后调用对应命令来执行。emacs 中的命令可以说就是一个函数，它是一个特殊的函数，是里面包含了 interactive 表达式的函数。这个表达式指明了这个命令的参数。比如下面这个命令(defun say-hello (name) (interactive "swhat's your name:") (message "hello, %s" name))当解释器加载了该函数之后就可以使用 M-x 来调用这个函数。我们根据提示输入一个名字，emacs会在minibuffer中输出一段话。我们发现，在interactive 表达式后面跟的字符串前面多了一个 s 字符。我们可以通过这个多加的字符来控制命令参数的类型和行为，例如使用 s 表示字符串参数，n 表示数字参数，f 代表文件，r 代表区域。interactive 的字符十分复杂，而且繁多。用的时候看 interactive 函数的文档还是很有必要的。但是不是所有时候都参数类型都能使用代码字符，而且一个好的命令，应该尽可能的让提供默认参数以让用户少花时间在输入参数上，这时，就有可能要自己定制参数。首先学习和代码字符等价的几个函数。s 对应的函数是 read-string，n 代表的是 read-file，f代表的是 read-file-name。其实大部分代码字符都是有这样对应的函数或替换的方法。我们可以使用这些方法来替代前面的代码字符，假如传入的是一个表达式，那么对表达式进行计算之后返回的列表元素就是命令的参数，例如我们用 read-string 来代替之前例子中的s。(defun say-hello (name) (interactive (list (read-string "what's your name: "))) (message "hello, %s" name))教程中还列举了一些常见的字符代表的函数，这里我就不列出来了。各位读者有兴趣的话也可以去看看。
- 2025年02月19日
- 52 阅读
- 0 评论
- 0 点赞
2025-02-11
Emacs 折腾日记（十二）——变量本文是依据 emacs lisp 简明教程而来在此之前我们已经了解了elisp中的全局变量和函数中的局部变量，也了解了elisp中各种数据类型。这一篇主要谈谈elisp中各种变量的生命周期和作用域let 绑定的变量使用let绑定的变量只在let范围内有效，如果是多层嵌套的let，只有最里层的那个变量是有效的，用 setq 改变的也只是最里层的变量，而不影响外层的变量。比如(progn (setq foo "I'm global variable!") (let ((foo 5)) (message "foo value is: %S" foo) ;; ==> "foo value is: 5" (let (foo) (setq foo "I'm local variable!") (message foo)) ;; ==> "i’m local variable!" (message "foo value is still: %S" foo)) ;; ==> "foo value is still: 5" (message foo)) ;; ==> "i’m global variable!"这个有点像C/C++中的{} 定义的语句块中的变量只在当前 {} 内有效，当内部变量与外部变量重名的时候只影响{}内，而不影响外部。我们可以给出这样的c++代码int n = 0; printf("n = %d\n", n); { int n = 10; printf("n = %d\n", n); } printf("n = %d\n", n);elisp中的let两边的括号就有点像这里的 {}，出了这个范围定义的变量就无效了。但是定义变量使用的是栈空间，而程序的栈空间是有大小限制的，一旦超过这个范围就会发生栈溢出。在C/C++程序中一般发生在递归层数过大。我们可以在编译时修改这个栈空间的大小。在elisp中也有变量控制递归层数，它就是 max-specpdl-size 但是在最新的29中已经将它弃用，新版的emacs可以使用 max-lisp-eval-depth 来限制specpdl堆栈的大小，该堆栈主要用于存储动态变量绑定和 unwind-protect 激活等。buffer-local 变量顾名思义，它的值只在当前buffer中生效，在其他buffer中可能是另外的值。它有点像之前介绍的vim中的setlocal变量，仅在当前缓冲区内生效。该特性常用于实现缓冲区特定的配置和行为。声明一个 buffer-local 的变量可以用 make-variable-buffer-local 或用 make-local-variable。这两个函数的区别在于前者是在所有缓冲区都创建一个 buffer-local 的变量。而后者只在声明时所在的缓冲区内产生一个局部变量，而其它缓冲区仍然使用的是全局变量。一般来说推荐使用 make-local-variable。下面来举例说明它们的区别，在举例之前介绍例子中用到的函数或者宏with-current-buffer, 它的使用方式是(with-current-buffer buffer body)其中 buffer 可以是一个缓冲区对象，也可以是缓冲区的名字。它的作用是使其中的 body 表达式在指定的缓冲区里执行。default-value 可以访问符号所对应的全局变量下面是使用 make-local-variable 创建buffer-local变量的例子(setq foo "i'm a global variable!") (make-local-variable 'foo) foo ;; ==> "i'm a global variable!" (setq foo "i'm buffer-local variable in scratch buffer") foo ;; ==> "i'm buffer-local variable in scratch buffer" (with-current-buffer "*Messages*" (progn (message "%s" foo) ;; ==> "i'm a global variable!" (setq foo "i'm buffer-local variable in message buffer") (message "%s" foo))) ;; ==> "i'm buffer-local variable in message buffer" (default-value 'foo) ;; ==> i'm buffer-local variable in message buffer上述代码因为message buffer 中未定义foo的buffer-local 变量，所以它修改的是全局变量的值，我们使用 default-value 发现全局变量的值被修改了。(setq foo "i'm a global variable!") (make-variable-buffer-local 'foo) foo (setq foo "i'm buffer-local variable in scratch buffer") foo (with-current-buffer "*Messages*" (progn (message "%s" foo) (setq foo "i'm buffer-local variable in message buffer") (message "%s" foo))) (default-value 'foo) ;; ==> "i'm a global variable!"前面的结果都一样，但是我们关注一下最后输出的全局的 foo 变量，它的值没有被修改，而使用 make-local-variable 的时候它被修改了。这是因为 make-variable-buffer-local 会在每一个缓冲区内都创建一个 buffer-local 的拷贝，所以后面在 message 缓冲区中修改的是缓冲区内自己的 buffer-local 变量而不影响全局变量的值，而 make-local-variable则不同，它会在 message 缓冲区中为foo也创建一个buffer-local变量。message 缓冲区中修改的是 buffer-local 变量，不影响全局的foo变量。一般来说根据实际情况选择使用哪种，我并不是资深的elisp开发者，以我浅薄的认知，一般使用 make-local-variable情况较多，它影响面较小，仅仅影响当前缓冲区。而make-variable-buffer-local 影响面较大，一旦使用它设置了local-buffer 变量，那么在后面其他缓冲区中想要使用 setq 设置全局的值就没那么简单了。这种一般是需要隐藏起来的核心变量，例如某些功能依靠这个变量来驱动，一旦修改了可能导致后面的代码运行行为不准确。可能会使用 make-variable-buffer-local 定义，不让用户自己随便修改全局的值。我们可以使用 setq-default 来设置全局变量的值。这里的例子就不给出了，各位读者可以根据上面的例子稍加修改就可以了。测试一个变量是不是 buffer-local 可以用 local-variable-p。这里我们再介绍一个新的函数 get-buffer。它需要一个buffer的名称作为参数，返回这个buffer的对象，如果未找到对应的buffer，则返回nil。(setq foo 5) (make-local-variable 'foo) (local-variable-p 'foo) ;; ==> t (local-variable-p 'foo (get-buffer "*Messages*")) ;; ==> nil如果要在当前缓冲区里得到其它缓冲区的 buffer-local 变量的值可以用 buffer-local-value(setq foo "i'm a global variable!") (make-local-variable 'foo) (setq foo "i'm buffer-local variable in scratch buffer") (with-current-buffer "*Messages*" (buffer-local-value 'foo (get-buffer "*scratch*"))) ;; ==> "i'm buffer-local variable in scratch buffer"变量的作用域在之前我们已经介绍过几种变量，分别是使用 setq 或者 defvar 定义的变量，它们是全局变量，即使在一些语法块或者函数中定义的，在外围也可以正常访问使用 let 或者 let* 定义的变量，只在 let 语法块中有效使用 make-local-variable 或者 make-variable-buffer-local 定义的buffer-local 变量，在当前buffer中有效但是函数参数列表的变量生命周期与我们平常在C/C++、Java、Python等语言中有些不同。作用域（scope）是指变量在代码中能够访问的位置。emacs lisp 这种绑定称为 indefinite scope。indefinite scope 也就是说可以在任何位置都可能访问一个变量名。而 lexical scope（词法作用域）指局部变量只能作用在函数中和一个块里（block）。比如 let 绑定和函数参数列表的变量在整个表达式内都是可见的，这有别于其它语言词法作用域的变量。先看下面这个例子(defun foo(x) (getx)) (defun getx() x) (message "%s" (foo "hello,x")) ;; ==> "hello,x"我们可以看到最终成功输出了结果，而根据之前学习C/C++的经验，在C、C++等语言中，这样的代码是无法执行成功的，因为在getx中并未定义x的值。但是在elisp 中，foo函数执行期间，x变量的都是有效的且可以正常访问到的。当然，在elisp中，let也具有这一效果，在let的语法块中，定义的变量总是有效的。例如(let ((x "hello, x")) (message "%s" (getx))) (defun getx() x)在let语句块中 x 是一直有效的，如果脱离let，在最外层调用 getx 将会得到一个x未定义的错误需要注意的是，上面的例子无法再使用 C-x C-e 来一条条的执行了，这个时候需要使用 eval-buffer 来执行整个缓冲区的代码。emacs 从 24.1 版本开始，引入了 lexical binding 这一特性，在代码中如果启用这个属性，那么它将采用C/C++ 等普通编程语言的那种 lexical scope 的作用形式。官方文档中提到使用 lexical binding 特性可以提高代码的运行效率，并且鼓励使用。可以在代码文件最开始的位置添加这么一个注释 -*- lexical-binding: t -*- 来开启这一特性。上面的代码只要加上这一特性就能得到不一样的结果;; -*- lexical-binding: t -*- (let ((x "hello, x")) (message "%s" (getx))) (defun getx() x)这个时候执行将会得到一个错误信息 "Symbol’s value as variable is void: x"，x这个符号是一个未定义的变量。生存期是指程序运行过程中，变量什么时候是有效的。全局变量和 buffer-local 变量都是始终存在的，前者只能当关闭emacs 或者用 unintern 从 obarray 里除去时才能消除。而 buffer-local 的变量也只能关闭缓冲区或者用 kill-local-variable 才会消失。而对于局部变量，elisp 使用的方式称为动态生存期：只有当绑定了这个变量的表达式运行时才是有效的。在 emacs lisp 简明教程中举了一个闭包的例子，在elisp中并不支持闭包，它采用的是与普通编程语言一样的变量生存周期，这里我就不列出来了。JavaScript等语言中是支持闭包的，有兴趣的读者可以去看看JavaScript中的闭包。其他函数一个符号如果值为空，直接使用可能会产生一个错误。可以用 boundp 来测试一个变量是否有定义。这通常用于 elisp 扩展的移植（用于不同版本或 XEmacs）。对于一个 buffer-local 变量，它的缺省值可能是没有定义的，这时用 default-value 函数可能会出错。这时就先用 default-boundp 先进行测试。使一个变量的值重新为空，可以用 makunbound。要消除一个 buffer-local 变量用函数 kill-local-variable。可以用 kill-all-local-variables 消除所有的 buffer-local 变量。但是有属性 permanent-local 的不会消除，带有这些标记的变量一般都是和缓冲区模式无关的，比如输入法。(setq foo "I'm local variable!") foo ; ==> "I'm local variable!" (boundp 'foo) ; ==> t (default-boundp 'foo) ; ==> t (with-current-buffer "*Messages*" (boundp 'foo)) ; ==> t (makunbound 'foo) ; ==> foo foo ; This will signal an error (boundp 'foo) ; ==> t (default-boundp 'foo) ; ==> t (kill-local-variable 'foo) ; ==> foo (with-current-buffer "*Messages*" (boundp 'foo)) ; ==> t上面的例子需要注意以下几点这里只是使变量的值为空，并没有消除这个变量的符号。所以在执行makunbound 之后，关于foo 是否绑定的测试都是tkill-local-variable 只是消除了foo作为buffer-local变量，并没有影响到全局变量，所以在messages-buffer中测试它仍然是有效的变量变量命名习惯对于变量的命名，有一些习惯，这样可以从变量名就能看出变量的用途：hook 一个在特定情况下调用的函数列表，比如关闭缓冲区时，进入某个模式时。function 值为一个函数functions 值为一个函数列表flag 值为 nil 或 non-nilpredicate 值是一个作判断的函数，返回 nil 或 non-nilprogram 或 -command 一个程序或 shell 命令名form 一个表达式forms 一个表达式列表。map 一个按键映射（keymap）
- 2025年02月11日
- 15 阅读
- 0 评论
- 0 点赞
2025-01-21
Emacs折腾日记（十一）——求值规则截至到现在，我觉得我自己的elisp水平有了一定的提高，希望各位读者借助之前的文章也能有一些收获。现在已经可以尝试写一点elisp的程序了，但是如果想深入了解一下 lisp 是如何工作的，不妨先花些时间看看 lisp 的求值过程。对于我这样一个日常使用C/C++的程序员来说，习惯了C/C++的语法和写法，初次见到lisp这样使用括号并且主要是S-表达式的语言，开始总会有点不习惯，但是在尝试自己写了这么些文章之后，对lisp有那么一点感觉。这篇我想就着求值规则这篇文章以及自己的一些理解来尝试梳理一下自己是如何理解elisp表达式的。S表达式要理解S表达式，我们先从如何解析四则运算开始。在之前我鸽了一个系列就是使用C来实现C语言解析器的系列。在那个系列中提到，一个普通的4则运算最终会生成一个抽象语法树，例如 a * b - (c + d) 最终可以生成如下的抽象语法树 - / \ * + / \ / \ a b c d二叉树的每个节点，或者是叶节点，或者有2个子节点，叶节点可以用来存储数据。而每颗子树的根节点存储操作符，或者说表示要对数据进行的操作，而如果操作符需要一个或者多个操作数，那么可以对抽象语法树进行调整。可以用上面的图来表示树的话有些麻烦了，后来发明了点对表示法，如果只关心叶子节点，每颗子树的根节点采用.来表示，那么这颗二叉树可以表示为 ((a . b) . (c . d)) 。看到这里各位读者想到了什么呢？cons cell。S表达式是点对表示法的形式定义：原子 -> 数字 | 符号 S表达式 -> 原子 | (S表达式 . S表达式)所以，S表达式或者是原子，或者是递归的由其他S表达式构成的点对。虽然抽象语法树可以使用这种点对来描述，但是语法树大了，点的数量大了，其实也挺麻烦的，所以lisp中有一些简单的写法。回顾一下之前学习列表和cons cell的知识，简化也就得到了列表，例如'((a . b) . (c . d)) ⇒ ((a . b) c . d) '((a . b) . (c . (d . nil))) ⇒ ((a . b) c d)如果我们考虑这颗树的根节点，并且采用先序遍历的方式访问，结果仍然采用点对来表示，那么将得到这样的结果 (- (* a b) (+ c d))。这样我们得到了计算这个四则运算的lisp代码，这个它可以作为列表，也可以让lisp解释器来执行。到此为止，各位读者应该理解了S表达式。它其实就是对应了一颗语法树。现在看到S表达式也不那么恐惧了，解释器如何执行它似乎也慢慢的清晰起来了呢S表达式的求值理解了S表达式，再回过头来看看它的求值过程。所有的表达式可以分为三种：符号、列表和其它类型。我们来分别说明最简单的就是自求值表达式，前面说过数字、字符串、向量都是自求值表达式。还有两个特殊的符号 t 和 nil 也可以看成是自求值表达式。第二种表达式是符号。符号的求值结果就是符号的值。如果它没有值，就会出现 void-variable 的错误。第三种表达式是列表表达式。而列表表达式又可以根据第一个元素分为函数调用、宏调用和特殊表达式（special form）三种。根据上面对S表达式的理解，这里的第一个元素也就是放在语法树的每颗子树的根节点上，表示对它的子节点进行的操作，例如上面的加减乘除，或者使用car之类的函数。而它的子节点可以是一颗语法树，也可以是简单的值，对应在elisp中的话，就是这个操作可以针对上面两种自求值表达式或者符号值，也可以是另一个S表达式。整个求值过程就是不断的求子树然后使用根节点来对子树进行操作，例如针对上面的二叉树可以写下这么一段伪代码来实现求值float calc-ast(ast* pRoot) { switch(pRoot->eOprType) { case function: //函数调用 return function(calc-ast(pRoot->left), calc-ast(pRoot->right)); case math: // 数学计算 return calc-ast(pRoot->left) + calc-ast(pRoot->right); //这里以加法为例 .... default: calc-ast(pRoot->left); calc-ast(pRoot->right); break } }第一个元素如果是一个特殊表达式时，它的参数可能并不会全求值。这些特殊表达式通常是用于控制结构或者变量绑定。每个特殊表达式都有对应的求值规则。这个就根据具体的语法来定，例如 and 和 or 这些操作符具有短路的特性。本文内容到此就结束了，本文比较简单，算是对之前的一个总结，对lisp有一个大概的了解。最后，本文可能是年前最后一篇文章了，在这里提前祝各位读者新年快乐！
- 2025年01月21日
- 10 阅读
- 0 评论
- 0 点赞

1
2
3
4
...
11

Masimaro

348 文章数

32 评论量

人生倒计时

热门文章

1

在wsl2中安装archlinux
179 阅读 - 12/05
2

nvim番外之将配置的插件管理器更新为lazy
120 阅读 - 01/06
3

2018总结与2019规划
104 阅读 - 01/02
4

从零开始配置 vim(15)——状态栏配置
91 阅读 - 08/17
5

PDF标准详解（五）——图形状态
71 阅读 - 09/18

最新回复

pluinyiasnhg
2025-11-28

实操了一遍 Pavinberg 的 Emacs 教程，现在来学习 Masimaro 大佬的教程
pluinyiasnhg
2025-06-19

这张企业考核表，非常受启发
pluinyiasnhg
2025-06-17

这个“从零开始配置 vim”系列的内容顺序，有点像之前没看完的《Learn Vimscript the Hard Way》，但写得比这本书细致许多
anuroyxtyi
2025-03-06

这篇文章不错！
plppuqcyzl
2025-03-06

这篇文章不错！

标签云

舔狗日记

2015 - 2026 © Masimaro' s blog

已运行 00 天 00 时 00 分 00 秒

萌ICP备20249976号 | RSS SITEMAP