[Lua]字符串及字符串匹配
--lua中字符串索引从前往后是1,2,……,从后往前是-1,-2……。
--string库中所有的function都不会直接操作字符串,只返回一个结果
基本函数
函数 |
描述 |
示例 |
结果 |
len |
计算字符串长度 |
string.len("abcd") |
4 |
rep |
返回字符串s的n个拷贝(repeat重复) |
string.rep("abcd",2) |
abcdabcd |
lower |
返回字符串全部字母大写 |
string.lower("AbcD") |
abcd |
upper |
返回字符串全部字母小写 |
string.upper("AbcD") |
ABCD |
format |
返回一个类似printf的格式化字符串 |
string.format("the value is:%d",4) |
the value is:4 |
sub |
返回子字符串substring from index i to j of s |
string.sub("abcd",2) |
bcd |
string.sub("abcd",-2) |
cd |
||
string.sub("abcd",2,-2) |
bc |
||
string.sub("abcd",2,3) |
bc |
||
find |
在字符串中查找,找到则返回匹配串开始索引和结束索引,否则返回nil。第三个参数是可选的:标示目标串中搜索的起始位置。 |
string.find("cdcdcdcd","ab") |
nil |
string.find("cdcdcdcd","cd") |
1 2 |
||
string.find("cdcdcdcd","cd",7) |
7 8 |
||
gsub |
全局字符串替换 在字符串中替换(substitution替换),有三个参数:目标串,模式串,替换串。第四个参数是可选的,用来限制替换的范围 |
string.gsub("abcdabcd","a","z"); |
zbcdzbcd 2 |
string.gsub("aaaa","a","z",3); |
zzza 3 |
||
byte |
返回字符的整数形式,字符->数字 |
string.byte("ABCD",4) |
68 |
char |
将整型数字转成字符并连接,数字->字符 |
string.char(97,98,99,100) |
abcd |
基本模式串
字符类 |
描述 |
示例 |
结果 |
. |
任意字符 |
string.find("",".") |
nil |
%s |
空白符(space) |
string.find("ab cd","%s%s") |
3 4 |
%S |
非空白符 |
string.find("ab cd","%S%S") |
1 2 |
%p |
标点字符(punctuation) |
string.find("ab,.cd","%p%p") |
3 4 |
%P |
非标点字符 |
string.find("ab,.cd","%P%P") |
1 2 |
%c |
控制字符(control) |
string.find("abcd\t\n","%c%c") |
5 6 |
%C |
非控制字符 |
string.find("\t\nabcd","%C%C") |
3 4 |
%d |
数字(digit) |
string.find("abcd12","%d%d") |
5 6 |
%D |
非数字 |
string.find("12abcd","%D%D") |
3 4 |
%x |
十六进制数字(hexadecimal) |
string.find("efgh","%x%x") |
1 2 |
%X |
非十六进制数字 |
string.find("efgh","%X%X") |
3 4 |
%a |
字母(alpha) |
string.find("AB12","%a%a") |
1 2 |
%A |
非字母 |
string.find("AB12","%A%A") |
3 4 |
%l |
小写字母(lowercase) |
string.find("ABab","%l%l") |
3 4 |
%L |
大写字母 |
string.find("ABab","%L%L") |
1 2 |
%u |
大写字母(uppercase) |
string.find("ABab","%u%u") |
1 2 |
%U |
非大写字母 |
string.find("ABab","%U%U") |
3 4 |
%w |
字母和数字 |
string.find("a1()","%w%w") |
1 2 |
%W |
非字母非数字 |
string.find("a1()","%W%W") |
3 4 |
转义字符%
字符类 |
描述 |
示例 |
结果 |
% |
转义字符 |
string.find("abc%..","%%") |
4 4 |
string.find("abc..d","%.%.") |
4 5 |
用[]创建字符集,"-"为连字符,"^"表示字符集的补集
字符类 |
描述 |
示例 |
结果 |
[01] |
匹配二进制数 |
string.find("32123","[01]") |
3 3 |
[AB][CD] |
匹配AC、AD、BC、BD |
string.find("ABCDEF","[AB][CD]") |
2 3 |
[[]] |
匹配一对方括号[] |
string.find("ABC[]D","[[]]") |
4 5 |
[1-3] |
匹配数字1-3 |
string.find("312","[1-3][1-3][1-3]") |
1 3 |
[b-d] |
匹配字母b-d |
string.find("dbc","[b-d][b-d][b-d]") |
1 3 |
[^%s] |
匹配任意非空字符 |
string.find(" a ","[^%s]") |
3 3 |
[^%d] |
匹配任意非数字字符 |
string.find("123a","[^%d]") |
4 4 |
[^%a] |
匹配任意非字母字符 |
string.find("abc1","[^%a]") |
4 4 |
用"()"进行捕获
字符类 |
描述 |
示例 |
结果 |
() |
捕获字符串 |
string.find("12ab","(%a%a)") |
3 4 ab |
string.find("ab12","(%d%d)") |
3 4 12 |
捕获是这样一种机制:可以使用模式串的一部分匹配目标串的一部分。将你想捕获的模式用圆括号括起来,就指定了一个捕获。
print(string.find("name = Anna", "(%a+)%s*=%s*(%a+)"))--1 11 name Anna,匹配并捕获结果
print(string.find("name = Anna", "%a+%s*=%s*%a+"))--1 11,只匹配不捕获结果
'%a+' 表示菲空的字母序列;'%s*' 表示0个或多个空白。
在上面的例子中,整个模式代表:一个字母序列,后面是任意多个空白,然后是 '=' 再后面是任意多个空白,然后是一个字母序列。两个字母序列都是使用圆括号括起来的子模式,当他们被匹配的时候,他们就会被捕获。当匹配发生的时候,find函数总是先返回匹配串的索引下标,然后返回子模式匹配的捕获部分。
模式修饰符
模式修饰符总是必须放在被修饰的后面。如要匹配1个多个数字---print(string.find("[17/1/2015]", "%d+"))--2 3
修饰符 |
描述 |
示例 |
结果 |
+ |
表示1个或多个,匹配最多个 |
string.find("aaabbb","(a+b)") |
1 4 aaab |
string.find("cccbbb","(a+b)") |
nil |
||
- |
表示0个或多个,匹配最少个 |
string.find("zzxyyy","(xy-)") |
3 3 x |
string.find("zzzyyy","(x-y)") |
4 4 y |
||
* |
表示0个或多个,匹配最多个 |
string.find("mmmnnn","(m*n)") |
1 4 mmmb |
string.find("lllnnn","(m*n)") |
4 4 n |
||
? |
表示0个或1个 |
string.find("aaabbb","(a?b)") |
3 4 ab |
string.find("cccbbb","(a?b)") |
4 4 b |
应用实例
local number = {}--给数字添加上千分号
function number.commaSeperate(num)local formatted,k = tostring(tonumber(num)),0while true do --匹配以[0,1]个减号,[1,n]个数字为开头,紧挨着3个数字,然后再模式1和模式2之间添加上逗号formatted, k = string.gsub(formatted,"^(-?%d+)(%d%d%d)",'%1,%2') if k == 0 then break endend return formatted
end
local str = number.commaSeperate("-456852963")
print(str)---456,852,963function string.ltrim(str)return string.gsub(str, "^[ \t\n\r]+", "")
endfunction string.rtrim(str)return string.gsub(str, "[ \t\n\r]+$", "")
endfunction string.trim(str)str = string.gsub(str, "^[ \t\n\r]+", "")return string.gsub(str, "[ \t\n\r]+$", "")
end
String库扩展
--------------------------------
-- @module stringstring._htmlspecialchars_set = {}
string._htmlspecialchars_set["&"] = "&"
string._htmlspecialchars_set["\""] = """
string._htmlspecialchars_set["'"] = "'"
string._htmlspecialchars_set["<"] = "<"
string._htmlspecialchars_set[">"] = ">"-- start ----------------------------------
-- 将特殊字符转为 HTML 转义符
-- @function [parent=#string] htmlspecialchars
-- @param string input 输入字符串
-- @return string#string 转换结果--[[--将特殊字符转为 HTML 转义符~~~ luaprint(string.htmlspecialchars("<ABC>"))
-- 输出 <ABC>~~~]]-- end --function string.htmlspecialchars(input)for k, v in pairs(string._htmlspecialchars_set) doinput = string.gsub(input, k, v)endreturn input
end-- start ----------------------------------
-- 将 HTML 转义符还原为特殊字符,功能与 string.htmlspecialchars() 正好相反
-- @function [parent=#string] restorehtmlspecialchars
-- @param string input 输入字符串
-- @return string#string 转换结果--[[--将 HTML 转义符还原为特殊字符,功能与 string.htmlspecialchars() 正好相反~~~ luaprint(string.restorehtmlspecialchars("<ABC>"))
-- 输出 <ABC>~~~]]-- end --function string.restorehtmlspecialchars(input)for k, v in pairs(string._htmlspecialchars_set) doinput = string.gsub(input, v, k)endreturn input
end-- start ----------------------------------
-- 将字符串中的 \n 换行符转换为 HTML 标记
-- @function [parent=#string] nl2br
-- @param string input 输入字符串
-- @return string#string 转换结果--[[--将字符串中的 \n 换行符转换为 HTML 标记~~~ luaprint(string.nl2br("Hello\nWorld"))
-- 输出
-- Hello<br />World~~~]]-- end --function string.nl2br(input)return string.gsub(input, "\n", "<br />")
end-- start ----------------------------------
-- 将字符串中的特殊字符和 \n 换行符转换为 HTML 转移符和标记
-- @function [parent=#string] text2html
-- @param string input 输入字符串
-- @return string#string 转换结果--[[--将字符串中的特殊字符和 \n 换行符转换为 HTML 转移符和标记~~~ luaprint(string.text2html("<Hello>\nWorld"))
-- 输出
-- <Hello><br />World~~~]]-- end --function string.text2html(input)input = string.gsub(input, "\t", " ")input = string.htmlspecialchars(input)input = string.gsub(input, " ", " ")input = string.nl2br(input)return input
end-- start ----------------------------------
-- 用指定字符或字符串分割输入字符串,返回包含分割结果的数组
-- @function [parent=#string] split
-- @param string input 输入字符串
-- @param string delimiter 分割标记字符或字符串
-- @return array#array 包含分割结果的数组--[[--用指定字符或字符串分割输入字符串,返回包含分割结果的数组~~~ lualocal input = "Hello,World"
local res = string.split(input, ",")
-- res = {"Hello", "World"}local input = "Hello-+-World-+-Quick"
local res = string.split(input, "-+-")
-- res = {"Hello", "World", "Quick"}~~~]]-- end --function string.split(input, delimiter)input = tostring(input)delimiter = tostring(delimiter)if (delimiter=='') then return false endlocal pos,arr = 0, {}-- for each divider foundfor st,sp in function() return string.find(input, delimiter, pos, true) end dotable.insert(arr, string.sub(input, pos, st - 1))pos = sp + 1endtable.insert(arr, string.sub(input, pos))return arr
endfunction string.split2(s, sep)local t = {}for o in string.gmatch(s, "([^" .. (sep or " ") .. "]+)") do table.insert(t, o) endreturn t
end-- start ----------------------------------
-- 去除输入字符串头部的空白字符,返回结果
-- @function [parent=#string] ltrim
-- @param string input 输入字符串
-- @return string#string 结果
-- @see string.rtrim, string.trim--[[--去除输入字符串头部的空白字符,返回结果~~~ lualocal input = " ABC"
print(string.ltrim(input))
-- 输出 ABC,输入字符串前面的两个空格被去掉了~~~空白字符包括:- 空格
- 制表符 \t
- 换行符 \n
- 回到行首符 \r]]-- end --function string.ltrim(input)return string.gsub(input, "^[ \t\n\r]+", "")
end-- start ----------------------------------
-- 去除输入字符串尾部的空白字符,返回结果
-- @function [parent=#string] rtrim
-- @param string input 输入字符串
-- @return string#string 结果
-- @see string.ltrim, string.trim--[[--去除输入字符串尾部的空白字符,返回结果~~~ lualocal input = "ABC "
print(string.rtrim(input))
-- 输出 ABC,输入字符串最后的两个空格被去掉了~~~]]-- end --function string.rtrim(input)return string.gsub(input, "[ \t\n\r]+$", "")
end-- start ----------------------------------
-- 去掉字符串首尾的空白字符,返回结果
-- @function [parent=#string] trim
-- @param string input 输入字符串
-- @return string#string 结果
-- @see string.ltrim, string.rtrim--[[--去掉字符串首尾的空白字符,返回结果]]-- end --function string.trim(input)input = string.gsub(input, "^[ \t\n\r]+", "")return string.gsub(input, "[ \t\n\r]+$", "")
end-- start ----------------------------------
-- 将字符串的第一个字符转为大写,返回结果
-- @function [parent=#string] ucfirst
-- @param string input 输入字符串
-- @return string#string 结果--[[--将字符串的第一个字符转为大写,返回结果~~~ lualocal input = "hello"
print(string.ucfirst(input))
-- 输出 Hello~~~]]-- end --function string.ucfirst(input)return string.upper(string.sub(input, 1, 1)) .. string.sub(input, 2)
endlocal function urlencodechar(char)return "%" .. string.format("%02X", string.byte(char))
end-- start ----------------------------------
-- 将字符串转换为符合 URL 传递要求的格式,并返回转换结果
-- @function [parent=#string] urlencode
-- @param string input 输入字符串
-- @return string#string 转换后的结果
-- @see string.urldecode--[[--将字符串转换为符合 URL 传递要求的格式,并返回转换结果~~~ lualocal input = "hello world"
print(string.urlencode(input))
-- 输出
-- hello%20world~~~]]-- end --function string.urlencode(input)-- convert line endingsinput = string.gsub(tostring(input), "\n", "\r\n")-- escape all characters but alphanumeric, '.' and '-'input = string.gsub(input, "([^%w%.%- ])", urlencodechar)-- convert spaces to "+" symbolsreturn string.gsub(input, " ", "+")
end-- start ----------------------------------
-- 将 URL 中的特殊字符还原,并返回结果
-- @function [parent=#string] urldecode
-- @param string input 输入字符串
-- @return string#string 转换后的结果
-- @see string.urlencode--[[--将 URL 中的特殊字符还原,并返回结果~~~ lualocal input = "hello%20world"
print(string.urldecode(input))
-- 输出
-- hello world~~~]]-- end --function string.urldecode(input)input = string.gsub (input, "+", " ")input = string.gsub (input, "%%(%x%x)", function(h) return string.char(checknumber(h,16)) end)input = string.gsub (input, "\r\n", "\n")return input
end-- start ----------------------------------
-- 计算 UTF8 字符串的长度,每一个中文算一个字符
-- @function [parent=#string] utf8len
-- @param string input 输入字符串
-- @return integer#integer 长度--[[--计算 UTF8 字符串的长度,每一个中文算一个字符~~~ lualocal input = "你好World"
print(string.utf8len(input))
-- 输出 7~~~]]-- end --function string.utf8len(input)local len = string.len(input)local left = lenlocal cnt = 0local arr = {0, 0xc0, 0xe0, 0xf0, 0xf8, 0xfc}while left ~= 0 dolocal tmp = string.byte(input, -left)local i = #arrwhile arr[i] doif tmp >= arr[i] thenleft = left - ibreakendi = i - 1endcnt = cnt + 1endreturn cnt
end-- start ----------------------------------
-- 将数值格式化为包含千分位分隔符的字符串
-- @function [parent=#string] formatnumberthousands
-- @param number num 数值
-- @return string#string 格式化结果--[[--将数值格式化为包含千分位分隔符的字符串~~~ luaprint(string.formatnumberthousands(1924235))
-- 输出 1,924,235~~~]]-- end --function string.formatnumberthousands(num)local formatted = tostring(checknumber(num))local kwhile true doformatted, k = string.gsub(formatted, "^(-?%d+)(%d%d%d)", '%1,%2')if k == 0 then break endendreturn formatted
end-- start ----------------------------------
-- 判断字符串a是否有前缀b
-- @function [parent=#string] hasPrefix
-- @param string s 源字符串
-- @param string prefix 前缀字符串
-- @return string#boolean 是否--[[--~~~ luaprint(string.hasPrefix("btn_return","btn_"))
-- 输出 true~~~]]-- end --
function string.hasPrefix(s, prefix)if(s == nil or prefix == nil) then return false endlocal index = string.find(s, prefix)if(index == 1) then return true endreturn false
end-- start ----------------------------------
-- 判断字符串a是否有后缀b
-- @function [parent=#string] hasSuffix
-- @param string s 源字符串
-- @param string suffix 后缀字符串
-- @return string#boolean 是否--[[--~~~ luaprint(string.hasSuffix(“bj.png”,".png"))
-- 输出 true~~~]]
-- end --function string.GetShortName(str,maxLen)-- print(str,"===GetShortNameGetShortName===")maxLen = maxLen or 4local charNum = sting.getStringCharCount(str)if charNum > maxLen thenlocal byteSize = 0local index = 1for i = 1 , maxLen dolocal byteCount = 0local curByte = string.byte(str, index)--print(curByte,"===curBytecurBytecurBytecurByte===" .. maxLen .. " " ..charNum)if curByte > 0 and curByte < 128 then byteCount = 1 --1字节字符elseif curByte >= 192 and curByte < 224 thenbyteCount = 2 --双字节字符elseif curByte >= 224 and curByte < 240 thenbyteCount = 3 --汉字elseif curByte >= 240 and curByte < 248 thenbyteCount = 4 --4字节字符endbyteSize = byteSize + byteCountindex = index + byteCount -- 重置下一字节的索引endreturn string.sub(str,1,byteSize)..'..'elsereturn strend
end--计算字符串字符个数
function string.getStringCharCount(str)local lenInByte = #str-- print("--getStringCharCount--",lenInByte)local charCount = 0local i = 1while (i <= lenInByte) dolocal curByte = string.byte(str, i)-- print("curBytecurByte==",curByte)local byteCount = 1if curByte > 0 and curByte < 128 then byteCount = 1 --1字节字符elseif curByte >= 192 and curByte < 224 thenbyteCount = 2 --双字节字符elseif curByte >= 224 and curByte < 240 thenbyteCount = 3 --汉字elseif curByte >= 240 and curByte < 248 thenbyteCount = 4 --4字节字符endlocal char = string.sub(str, i, i + byteCount - 1)i = i + byteCount -- 重置下一字节的索引charCount = charCount + 1 -- 字符的个数(长度)endreturn charCount
endfunction string.hasSuffix(s, suffix)if(s == nil or suffix == nil) then return false endlocal pos = string.len(s) - string.len(suffix)return string.sub(s,pos + 1) == suffix
end
[Lua]字符串及字符串匹配相关推荐
- cell数组变为字符串_字符串匹配 ---- BM 算法原理
关于字符串匹配有很多算法, BF, BK, KMP, 但这些都不是这篇文章的重点. 文章的重点是另外一种更高效的算法 Boyer-Moore 算法, 一般文本编辑器中的查找功能都是基于它实现的. 前置 ...
- 字符串(字符串匹配)
一.字符串匹配问题.基础 1.假设文本是一个长度为n的数组T,而模式是长度为m的数组P,我们希望在文本T中寻找模式P 如果P出现在T中的第s个位置,那么我们称其有效偏移为s,在其他不匹配的位置称为无效 ...
- string返回第n个字符_Programming in Lualua学习第13期 Lua字符串库
微信公众号:GameToolDev 关注可了解更多的游戏工具开发教程.问题或建议,请公众号留言; 1. 基础字符串函数: 字符串库中有一些函数非常简单,如: 1). string.len( ...
- c int转字符串_【C++实现python字符串函数库】字符串匹配函数startswith与endswith
[C++实现python字符串函数库]字符串匹配函数startswith与endswith 这两个函数用于匹配字符串的开头或末尾,判断是否包含另一个字符串,它们返回bool值.startswith() ...
- 【字符串系列】字符串匹配中的位并行算法
[字符串系列]字符串匹配中的位并行算法 最近一段时间看了一点"柔性字符串匹配", 发现位并行算法在字符串匹配这个领域还是很有用的, 下面抒发一下鄙见. 首先, 字符串位并行算法在a ...
- java中字符串的精确匹配_Java最佳实践–字符串性能和精确字符串匹配
java中字符串的精确匹配 在使用Java编程语言时,我们将继续讨论与建议的实践有关的系列文章,我们将讨论String性能调优. 我们将专注于如何有效地处理字符串创建, 字符串更改和字符串匹配操作. ...
- Java最佳实践–字符串性能和精确字符串匹配
在使用Java编程语言时,我们将继续讨论与建议的实践有关的系列文章,我们将讨论String性能调优. 我们将专注于如何有效地处理字符串创建, 字符串更改和字符串匹配操作. 此外,我们将提供我们自己的用 ...
- # 字符串从右往左查找_字符串匹配(搜索,查找)算法
(一)前言 所谓的字符串匹配就是在一个长字符串(可称文本T)中找一个短字符串(可称模式P),看长字符串中是否存在短字符串,若存在则返回出现的第一个位置,若不存在则返回一个标记.字符串搜索算法有很多,比 ...
- 对比两个字符串相等_字符串匹配问题
0.题目 在一个主串S={a, b, c, c, b, c, a, b, d}, 模式串T={a, b, d};请找出模式串在主串中第一次出现的位置 提示: 不需要考虑字符串大小写问题,字符均为小写字 ...
最新文章
- python iter 迭代函数 简介
- ODBC访问数据库(转载)
- mssql sqlserver 使用sql脚本检测数据表中一列数据是否连续的方法分享
- fiddler实现将http请求的js转为本地的js文件
- 如何阻止 AcrobatPro DC自动更新升级?
- 小程序快速入门:wxss的使用
- 功能测试Ⅲ——缺陷及缺陷管理
- JavaScript的toast
- Qt 绘制南丁格尔玫瑰图
- 基于vue的分享插件
- Freeswitch 常用命令
- 2020-8-15词汇
- oracle 百分位数,Oracle分析函数PERCENTILE_CONT
- Python_day9:常用内建模块
- 多页面应用画拓扑图利器-jTopo
- 医保基金稽查案件管理系统丨陀螺研究院×FISCO BCOS案例专辑
- Response重定向
- 北京2008福娃2图标
- 甲骨文数据库学习内容
- 什么是平台(平台商业模式)