- 資訊首頁(yè) > 開(kāi)發(fā)技術(shù) > 編程語(yǔ)言 >
- c++11中如何使用regex正則表達式
c++11中如何使用regex正則表達式,很多新手對此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細講解,有這方面需求的人可以來(lái)學(xué)習下,希望你能有所收獲。
regex庫中涉及到的主要類(lèi)型有:
以std::string為代表的處理字符串的類(lèi)型(我們知道還有存儲wchar_t的wstring類(lèi)、原生c式字符串const char*等等,為了簡(jiǎn)化處理僅介紹std::string類(lèi)型相關(guān)的操作,當你把握住了regex的主脈絡(luò )之后,想使用其他的版本只要類(lèi)比就可以) std::regex類(lèi),該類(lèi)型需要一個(gè)代表正則表達式的字符串和一個(gè)文法選項作為輸入,當文法選項不提供時(shí)默認為ECMAScript。 std::match_results類(lèi),該類(lèi)用來(lái)記錄匹配的結果,這是一個(gè)模板類(lèi),該類(lèi)的模板參數是一個(gè)迭代器類(lèi)型,對于std::string來(lái)說(shuō)我們定義了smatch作為match_results<string::const_iterator>作為別名。 std::sub_match類(lèi),該類(lèi)其實(shí)封裝了兩個(gè)迭代器,第一個(gè)代表開(kāi)始部分,第二個(gè)代表結束部分,就像你用兩個(gè)下表索引去表達一個(gè)字符串的某一個(gè)子串一樣。這個(gè)類(lèi)就是通過(guò)這樣的方式提供原字符串的某一個(gè)子串作為結果。實(shí)際上match_results中就封裝了一些std::sub_match類(lèi)型的對象。(為什么是一些而不是一個(gè),因為一次匹配可能會(huì )產(chǎn)生多個(gè)結果返回,regex認為每個(gè)括號對構成一個(gè)子匹配項,regex匹配的結果可以顯式每個(gè)子匹配項匹配到的內容。) 現在我們有了表達字符串的類(lèi),表達正則匹配的類(lèi),表達匹配結果的類(lèi),接下來(lái)regex提供三個(gè)匹配函數:
bool std::regex_match(...)bool std::regex_search(...)string std::regex_replace(...)//實(shí)際上返回類(lèi)型是根據你輸入的數據類(lèi)型對應的basic_string類(lèi)。
首先說(shuō)明三個(gè)函數功能上的不同,std::regex_match是全文匹配,即它希望你輸入的字符串要和正則表達式全部匹配,才認為匹配成功,否則匹配失敗,而std::regex_search是在你輸入的字符串中不斷搜索符合正則表達式描述的子字符串,然后將第一個(gè)匹配到的子字符串返回。std::regex_replace是在std::regex_search的基礎上更進(jìn)一步,可以將匹配的子字符串替換為你提供的字符串。
看幾個(gè)例子:
#include <iostream>#include <string>#include <regex>int main() { std::regex pattern("\\d{4}"); std::string content("hello_2018"); std::smatch result; if (std::regex_match(content, result, pattern)) { std::cout << result[0]; } system("pause"); return 0;}
匹配失敗,什么都不會(huì )輸出。
這里說(shuō)明一下為什么輸出的是result[0],其實(shí)result[0]返回的就是一個(gè)sub_match類(lèi)型的對象。regex中認為正則表達式的每個(gè)括號對構成一個(gè)子匹配項,并認為整個(gè)字符串作為0號子匹配項,然后根據左括號出現的位置,從1號開(kāi)始編號,因此返回的result[0]就是匹配整個(gè)正則表達式的字符串。
#include <iostream>#include <string>#include <regex>int main() { std::regex pattern("\\d{4}"); std::string content("hello_2018 by_2017"); std::smatch result; if (std::regex_search(content, result, pattern)) { std::cout << result[0]; } system("pause"); return 0;}
搜索到第一個(gè)符合正則表達式的子串,輸出 2018。
#include <iostream>#include <string>#include <regex>int main() { std::regex pattern("\\d{4}"); std::string content("hello_2018 by_2017"); std::smatch result; auto begin = content.cbegin(); auto end = content.cend(); while (std::regex_search(begin, end, result, pattern)) { std::cout << result[0] << " "; begin = result[0].second; } system("pause"); return 0;}
用上述方式可以輸出字符串中所有符合正則表達式匹配要求的字符串,輸出 2018 2017。
#include <iostream>#include <string>#include <regex>int main() { std::regex pattern("\\d{4}"); std::string content("hello_2018 by_2017"); std::string result = std::regex_replace(content, pattern, "everyone"); std::cout << result; system("pause"); return 0;}
輸出 hello_everyone by_everyone。
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng )、來(lái)自本網(wǎng)站內容采集于網(wǎng)絡(luò )互聯(lián)網(wǎng)轉載等其它媒體和分享為主,內容觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如侵犯了原作者的版權,請告知一經(jīng)查實(shí),將立刻刪除涉嫌侵權內容,聯(lián)系我們QQ:712375056,同時(shí)歡迎投稿傳遞力量。
Copyright ? 2009-2022 56dr.com. All Rights Reserved. 特網(wǎng)科技 特網(wǎng)云 版權所有 特網(wǎng)科技 粵ICP備16109289號
域名注冊服務(wù)機構:阿里云計算有限公司(萬(wàn)網(wǎng)) 域名服務(wù)機構:煙臺帝思普網(wǎng)絡(luò )科技有限公司(DNSPod) CDN服務(wù):阿里云計算有限公司 百度云 中國互聯(lián)網(wǎng)舉報中心 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2
建議您使用Chrome、Firefox、Edge、IE10及以上版本和360等主流瀏覽器瀏覽本網(wǎng)站