C++實現String類的方法詳解
前言
在C語言中,沒有專門用來表示字符串的類型。C語言的字符串是一系列以’\0’為結尾的字符的集合。雖然C語言為這樣的字符串提供瞭一系列的庫函數如strcpy, strcmp等等,但這些函數與字符串這個類型是分開的,這不太符合C++中面試對象的思想,所以在C++中封裝瞭一個string類,來幫助我們操作字符串。string該如何使用,我這裡就不做贅述瞭,大傢可以去看看官方文檔呀
string – C++ Reference (cplusplus.com)
string模擬實現
string簡單實現
首先我們不考慮string類的增刪查改,隻是先給string類搭建一個最簡單的框架出來。
和C語言中相同,為瞭存儲一個字符串,我們的string類需要一個char*的指針來指向字符像這個對象。作為一個對象,string還需要有構造函數,析構函數和拷貝構造。
class string { private: char *_str; public: string(const char *str) : _str(new char[strlen(str) + 1]) // +1 是給'\0'留出位置 { strcpy(_str, str); } string(const string &str) : _str(new char[strlen(str._str) + 1]) { strcpy(_str, str._str); } ~string() { if (_str) { delete[] _str; _str = nullptr; } } };
有的朋友可能會疑惑,這裡的構造函數和拷貝構造函數為什麼不用編譯器自動生成的,直接將_str指向原本的字符串就可以瞭,為什麼還要開辟空間呢?
這是因為我們在日常使用中,假如有兩個string類 a 和 b,b是由a拷貝構造而來,一般情況下我們在修改b的同時不希望a也被改。此外,如果直接將_str指向原本的字符串會導致的問題是當 a 和 b用完被銷毀時,會對同一片空間調用兩次析構函數,對同一片空間釋放兩次。所以在這裡,我們需要重新開辟一片空間來給這個string。這也就是所謂的深拷貝。
然後,為瞭訪問string類中的元素,我們需要對運算符[]進行重載。
char& operator[](size_t pos) { assert(pos < strlen()) return _str[pos]; }
這樣我們就實現瞭一個簡單的string類。
string完整實現
構造函數,析構函數,拷貝構造
之前我們實現的一個string類是一個最簡單的string類,它沒有辦法進行增刪查改,接下來我們就來一點一點完善它。
要實現增刪查改,我們還需要兩個變量,一個記錄string類當前長度,一個記錄string類的容量大小。加入這兩個變量後,我們原本的構造函數,拷貝構造和析構函數需要發生一點點變化。
class string { private: char *_str; size_t _size; size_t _capacity; public: string(const char *str = "") : _size(strlen(str)), _capacity(_size) { _str = new char[_capacity + 1]; strcpy(_str, str); } string(const string &str) : _size(str._size), _capacity(str._capacity) { _str = new char[_size + 1]; strcpy(_str, str._str); } ~string() { if (_str) { delete[] _str; _str = nullptr; _size = _capacity = 0; } } };
運算符重載
接下來我們來實現一下,string類的運算符。在實現運算符重載時,我們需要做的隻是實現少數幾個運算符即可,其他的運算符可復用前面實現的運算符來達到我們想要的效果。
//關系運算符的重載 bool operator>(const string &s) { return strcmp(_str, s.c_str()); } bool operator==(const string &s) { return strcmp(_str, s.c_str()) == 0; } bool operator!=(const string &s) { return !(*this == s); } bool operator>=(const string &s) { return *this > s || *this == s; } bool operator<(const string &s) { return !(*this >= s); } bool operator<=(const string &s) { return !(*this > s); } //操作運算符的重載 string &operator=(string& str) { if(*this != str) { char *tmp = new char[str._capacity + 1]; strcpy(tmp,str._str); delete[] _str; _str = tmp; _size = str._size; _capacity = str._capacity; } return *this; } char &operator[](size_t pos) { assert(pos < _size); return *(_str + pos); } const char &operator[](size_t pos) const { assert(pos < _size); return *(_str + pos); }
string接口實現
首先是比較簡單的size(),empty(),capacity(),clear()。這些接口大部分直接訪問string類的成員變量就可以得到結果。
size_t size() const { return _size; } size_t capacity() const { return _capacity; } bool empty() const { return 0 == _size; } //後面添加const的目的是為瞭讓所有對象都可以進行訪問 void clear() { _str[0] = '\0'; _size = 0; _capacity = 0; }
因為後面的接口大部分都需要進行空間的調整,所以首先我們將調整空間的接口,reserve和resize實現。
void reserve(size_t n) { if (n > _capacity) //判斷是否需要擴容 { char *tmp = new char[n + 1]; strcpy(tmp, _str); delete[] _str; _str = tmp; _capacity = n; } } //resize和reserve的區別在於,reserve隻是開空間,而resize還要進行初始化 void resize(size_t n, char c = '\0') { if (n > _capacity) { reserve(n); //開空間復用reserve } for (size_t i = _size; i < n; ++i) { _str[i] = c; } _size = n; _str[_size] = '\0'; }
接下來是插入的實現,首先是push_back,這個比較簡單,找到尾部進行插入即可。
void push_back(char n) { if (_size == _capacity) { reserve(_capacity == 0 ? 4 : _capacity * 2); //開空間復用reserve } _str[_size++] = n; _str[_size] = '\0'; }
接下來是insert,這個較push_back而言要麻煩一些,因為除瞭尾插,其他地方去插入數據你都需要挪動後面數據的位置。
string &insert(size_t pos, const char *str) { //檢查空間是否足夠 assert(pos <= _size); size_t len = strlen(str); if (len + _size > _capacity) { reserve(len + _size); } //挪動後面的數據 size_t end = _size + len; while (end != pos + len - 1) { _str[end] = _str[end - len]; --end; } //數據插入 strncpy(_str + pos, str, len); _size += len; return *this; }
寫完瞭插入,接下來當然就是刪除接口:eraser
string &eraser(size_t pos, size_t len = npos) //npos為靜態變量,值為-1 { assert(pos < _size); if (len == npos || pos + len >= _size) //將位置後的元素全部刪除 { _str[pos] = '\0'; _size = pos; } else //刪除位置後的部分元素 { size_t begin = pos + len; while (begin <= _size) { _str[begin - len] = _str[begin]; begin++; } _size = _size - len; } return *this; }
迭代器的實現
C++中的迭代器和指針類似。為什麼要有迭代器呢?因為C++中有各種各樣的容器,每個容器它背後的存儲方式不同,訪問方式也不同,為瞭讓使用者的使用成本降低,使大部分容器可以以相同的方式去訪問,就有瞭迭代器的產生。
接下來我們來實現string的迭代器,其實string的迭代器就是一個指針。並不用去封裝特別的東西。
typedef char *iterator; typedef const char *const_iterator; const_iterator begin() const { return _str; } const_iterator end() const { return _str + _size; } iterator begin() { return _str; } iterator end() { return _str + _size; }
部分函數優化和完善
前面在寫運算符重載時,還有部分運算符未重載在此加上
string &operator+=(const char *str) { append(str); } string &operator+=(char n) { push_back(n); return *this; }
同時增加拷貝構造和operator=的現代寫法,之前我們寫拷貝構造和operator=時都需要自己去重新開空間,那麼這個活可不可以讓其他人幫我做呢?
我們來看看下面這一段代碼
void swap(string& str) { std::swap(_str, str._str); std::swap(_size, str._size); std::swap(_capacity, str._capacity); } string(const string &s) : _str(nullptr), _size(0), _capacity(0) { string tmp(s._str); swap(tmp); } string &operator=(string s) { swap(s); return *this; }
上述代碼同樣可以幫我們完成拷貝構造和operator= ,原理如下:
1.首先是拷貝構造,我們在拷貝構造中使用構造函數去創建一個臨時對象,這個臨時對象在創建時,就幫我們開辟瞭空間。然後我們將臨時對象和此對象的所有成員進行一個交換,這樣此對象就可以接管臨時對象創建的那塊空間,我們的拷貝構造也就成功瞭
2.在operator=這,我們使用的是傳值傳參。好處在於由於我們的string類是自定義對象,所以在傳參時會去調用拷貝構造,這樣傳過來的str參數也擁有瞭自己的空間,此時我們和拷貝構造一樣,將str所開辟的那塊空間接管,同時由於str是函數參數,當函數結束時,str會去調用析構函數進行一個空間釋放。
完整代碼
class string { public: typedef char *iterator; typedef const char *const_iterator; const_iterator begin() const { return _str; } const_iterator end() const { return _str + _size; } iterator begin() { return _str; } iterator end() { return _str + _size; } string(const char *s = "") : _size(strlen(s)), _capacity(_size) { _str = new char[_capacity + 1]; strcpy(_str, s); } string(const string &s) : _str(nullptr), _size(0), _capacity(0) { string tmp(s._str); swap(tmp); } ~string() { delete[] _str; _str = nullptr; _size = _capacity = 0; } string &operator=(string s) { swap(s); return *this; } char &operator[](size_t pos) { assert(pos < _size); return *(_str + pos); } const char &operator[](size_t pos) const { assert(pos < _size); return *(_str + pos); } const char *c_str() const { return _str; } void reserve(size_t n) { if (n > _capacity) { char *tmp = new char[n + 1]; strcpy(tmp, _str); delete[] _str; _str = tmp; _capacity = n; } } void push_back(char n) { if (_size == _capacity) { reserve(_capacity == 0 ? 4 : _capacity * 2); } _str[_size++] = n; _str[_size] = '\0'; } string &operator+=(char n) { push_back(n); return *this; } void append(const char *str) { size_t len = _size + strlen(str); if (len > _capacity) { reserve(len); } strcpy(_str + _size, str); _size = len; } string &operator+=(const char *str) { append(str); } void resize(size_t n, char c = '\0') { if (n > _capacity) { reserve(n); } for (size_t i = _size; i < n; ++i) { _str[i] = c; } _size = n; _str[_size] = '\0'; } size_t size() const { return _size; } size_t capacity() const { return _capacity; } bool empty() { return 0 == _size; } bool operator>(const string &s) { return strcmp(_str, s.c_str()); } bool operator==(const string &s) { return strcmp(_str, s.c_str()) == 0; } bool operator!=(const string &s) { return !(*this == s); } bool operator>=(const string &s) { return *this > s || *this == s; } bool operator<(const string &s) { return !(*this >= s); } bool operator<=(const string &s) { return !(*this > s); } string &insert(size_t pos, const char *str) { assert(pos <= _size); size_t len = strlen(str); if (len + _size > _capacity) { reserve(len + _size); } size_t end = _size + len; while (end != pos + len - 1) { _str[end] = _str[end - len]; --end; } strncpy(_str + pos, str, len); _size += len; return *this; } string &eraser(size_t pos, size_t len = npos) { assert(pos < _size); if (len == npos || pos + len >= _size) { _str[pos] = '\0'; _size = pos; } else { size_t begin = pos + len; while (begin <= _size) { _str[begin - len] = _str[begin]; begin++; } _size = _size - len; } return *this; } void clear() { _size = 0; _str[0] = '\0'; _capacity = 0; } void swap(string &s) { std::swap(_str, s._str); std::swap(_size, s._size); std::swap(_capacity, s._capacity); } size_t find(char c, size_t pos = 0) const { while (pos < _size) { if (_str[pos] == c) { return pos; } ++pos; } return npos; } size_t find(char *s, size_t pos = 0) const { const char *p = strstr(_str + pos, s); if (p == nullptr) { return npos; } else { return p - _str; } } private: char *_str; size_t _size; size_t _capacity; const static size_t npos; }; const size_t string::npos = -1;
到此這篇關於C++實現String類的方法詳解的文章就介紹到這瞭,更多相關C++ String類內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- C++string底層框架模擬實現代碼
- C++ String部分成員模擬實現流程詳解
- C++模擬實現string的方法詳解
- 深入淺出分析C++ string底層原理
- C++中vector的模擬實現實例詳解