一、C语言中的string类

C语言中,字符串是以‘\0’结尾的一些字符集合,为了操作方便,C标准库中提供了一些str系列的库函数,但这些库函数与字符串是分离的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会访问越界。

二、C++中的string类

1、string类

string类的文档介绍:cplusplus.com/reference/string/string/?kw=string

①字符串是表示字符序列的类。

②标准的字符串提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符串的设计特性。

③string类是basic_string模板的一个实例,它使用的char来实例化basic_string类模板,并用char_traits和allocator作为basic_stirng的默认参数。

④这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员以及它的迭代器,将按照字节(而不是实际编码的字符)来操作。

2、string类的常用接口说明

①string类对象的常见构造

函数名称

功能说明

string()

构造空的string类对象,即空字符串

string(const char* s)

用一个C语言的字符串来构造string类对象

string(size_t n, char c)

用n个字符c来构造string类对象

string(const string&s)

拷贝构造函数

②string类对象的容器操作

函数名称

功能说明

size

返回字符串有效字符的长度

length

返回字符串有效字符的长度

capacity

返回空间总大小

empty

检测字符串是否为空串,是返回true,否则返回false

clear

清空有效字符

reserve

改变字符串容量

resize 

将有效字符的个数改为n个,多出的空间用字符c填充

注意:

  • size()与length()方法底层实现原理完全相同 ,引入size()的原因是为了与其它容器的接口保持一致,一般情况下都是使用size()。
  • clear()只是将string中的有效字符清空,不改变容量的大小
  • resize(size_t n)与resize(size_t n,char c)都是将字符串中的有效字符改变到n个,不同的是当字符个数增多时:resize(size_t n)用'\0'来填充多出来的元素空间,resize(size_t n,char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果元素个数增多,可能会改变容量,如果元素个数减少,容量不会改变。
  • reserve(size_t n):改变字符串的容量,不改变字符串的有效个数,放reserve的参数小于string的容量时,reserve不会改变容量的大小。

③string类对象的访问及遍历操作

operator[]

返回pos位置的字符

begin+end

begin获取一个字符的迭代器+end获得最后一个字符下一个

位置的迭代器

范围for

C++11支持更简洁的范围for的新遍历方式

④string对象的修改操作

函数名称

功能说明

push_back

在字符串后尾插字符c

append

在字符串后追加一个字符串

operator+=

在字符串后追加一个字符串

c_str

返回C语言格式字符串

find

查找字符c第一次出现的位置

rfind

查找字符c最后一次出现的位置

substr

从字符串中pos位置开始,截取n个字符串返回

erase

任意位置删除

insert

任意位置插入

⑤string非成员函数

函数名称

功能说明

operator+

字符串相加,尽量少用,因为传值返回效率低

operator>>

输入运算符重载

operator<<

输出运算符重载

getline

获取一行字符串

3、VS和G++下string结构说明

注意:下属结构是在32位平台下验证的,32位平台下指针占4个字节。

①VS下string的结构

string总共占28个字节,内部结构稍微复杂一点,先是有一个联合体,联合体用来定义string中字符串的存储空间:

  • 当字符串长度小于16时,使用内部固定的字符数组来存放。
  • 当字符串长度大于等于16时,从堆上开辟空间。
union _Bxty
{ 	// storage for small buffer or pointer to larger one
		value_type _Buf[_BUF_SIZE];
		pointer _Ptr;
		char _Alias[_BUF_SIZE]; // to permit aliasing
} _Bx;

这种设计也是有一定道理的,大多数情况下字符串的长度都是小于16的,那string对象创建好后,内部已经有了16个字符数组的固定空间,不需要通过对创建,效率高。

其次:还有一个size_t字段保存字符串长度,一个size_t字段保存从堆上开辟空间总的容量

最后:还有一个指针做一些其他事情。

故总共占16+4+4+4=28个字节。

②G++下string的结构

G++下,string是通过写时拷贝实现的,string对象总共占4个字节,内部只包含了一个指针,该指针将来指向一块堆空间,内部包含了如下字段:

  • 容量
  • 字符串有效长度
  • 引用计数
struct _Rep_base
{
	size_type	 _M_length;
	size_type	 _M_capacity;
	_Atomic_word	 _M_refcount;
};
  • 指向堆空间的指针,用来存储字符串。

三、string类的模拟实现

1、成员变量

//string.h
namespace lsx
{
	typedef char* iterator;//迭代器
	typedef const char* const_iterator;//const迭代器
   //我们在这里实现的迭代器其实就是指针
	class string
	{
	public:
   private:
		size_t _size;//有效字符的长度
		size_t _capacity;//字符串容量
		char* _str;//指向存储字符串的空间
	public:
		const static size_t npos;//用来表示不能存的位置
      //一般在.cpp文件里定义
	};
}
//string.cpp
const size_t lsx::string::string::npos = -1;
//表示size_t类型的最大值

string类的模拟实现_字符串

2、构造函数

声明:

string(const char* str = "");//构造函数

使用了缺省值。

定义:

lsx::string::string(const char* str)//构造函数
	:_size(strlen(str))//计算str的长度
	,_capacity(_size)
{
	_str = new char[_capacity + 1];//用new开空间
	strncpy(_str, str, _capacity + 1);//把str的内容拷贝到_str
}

使用了初始化列表。

3、析构函数

声明:

~string();//析构函数

定义:

lsx::string::~string()//析构函数
{
	delete[]_str;//释放空间
	_str = nullptr;//指针置空
	_size = _capacity = 0;
}

4、拷贝构造函数

声明:

	string(const string& str);//拷贝构造函数

定义:

lsx::string::string(const string& str)//拷贝构造函数
{
	_str = new char[str._capacity+1];//开辟一样大的空间
	//复制内容
	strncpy(_str, str._str, str._size);
	_size = str._size;
	_capacity = str._capacity;
}

5、赋值重载函数

声明:

	string& operator=(const string& str);//赋值重载

定义:

lsx::string& lsx::string:: operator=(const string& str)//赋值重载
{
	if (this != &str)//防止自己给自己赋值
	{
		delete[]_str;//释放掉原来的空间
		_str = new char[str._capacity + 1];//开辟和str一样大的空间
		strncpy(_str, str._str, str._capacity + 1);//拷贝
		_size = str._size;
		_capacity = str._capacity;
	}
	return *this;
}

6、迭代器

声明:

iterator begin();//开始
		const_iterator begin()const;//开始
		iterator end();//结束
		const_iterator end()const;//结束

定义:

lsx::iterator lsx::string::begin()//开始
{
	return _str;
}
lsx::const_iterator lsx::string::begin()const//开始
{
	return _str;
}
lsx::iterator lsx::string::end()//结束
{
	return _str + _size;
}
lsx::const_iterator lsx::string::end()const//结束
{
	return _str + _size;
}

7、reserve函数

声明:

void reserve(size_t n);//修改容量

定义:

void lsx::string::reserve(size_t n)//修改容量
{
	if (n > _capacity)//只有n大于_capacity时才修改
	{
		char* tmp = new char[n + 1];//开辟新空间
		strncpy(tmp, _str,_size+1);//拷贝数据
		delete[]_str;//释放旧空间
		_str = tmp;
		_capacity = n;
	}
}

8、resize函数

声明:

void resize(size_t n, const char& c = '\0');//修改有效长度

使用缺省值

定义:

void lsx::string::resize(size_t n, const char& c)//修改有效长度
{
	if (n > _size)//如果n大于当前有效长度
	{
		reserve(n);
		for (int i = _size;i < n;++i)//拿字符c填充
		{
			_str[i] = c;
		}
		
	}
	_str[n] = '\0';
	_size = n;
}

string类的模拟实现_string类_02

9、empty函数

声明:

bool empty()const;//判空

定义:

bool lsx::string::empty()const//判空
{
	return _size == 0;
}

10、erase函数

声明:

string& erase(size_t pos, size_t len = npos);//删除

定义:

lsx::string& lsx::string::erase(size_t pos, size_t len)//删除
{
	//如果len不传参,就默认从pos开始删完
	assert(pos < _size);
	if (len == npos || pos + len > _size)//直接从pos开始删完
	{
		_str[pos] = '\0';
		_size = pos;
	}
	else//从pos删len个
	{
    //挪动数据覆盖
		for (int i = pos + len, j = pos;i <= _size;i++, j++)//
		{
			_str[j] = _str[i];
		}
		_size -= len;
	}
	return *this;
}

string类的模拟实现_string类_03

11、clear函数

声明:

void clear();//清空

定义:

void lsx::string::clear()//清空
{
	_str[0] = '\0';
	_size = 0;
}

12、swap函数

声明:

void swap(string& str);//交换

定义:

void lsx::string::swap(string& str)//交换
{
	std::swap(_size, str._size);
	std::swap(_capacity, str._capacity);
	std::swap(_str,str._str);
}

13、insert函数

声明:

string& insert(size_t pos, const char& c);//插入
string& insert(size_t pos, const char* str);//插入字符串

定义:

lsx::string& lsx::string::insert(size_t pos, const char& c)//插入
{
	assert(pos <= _size);
	if (_size == _capacity)
	{//扩容
		reserve(_capacity == 0 ? 4 : _capacity * 2);
	}
	for (int i = _size + 1;i > pos;i--)//挪数据
	{
		_str[i] = _str[i - 1];
	}
	_str[pos] = c;//插入c
	_size++;
	return *this;
}

lsx::string& lsx::string::insert(size_t pos, const char* str)//插入字符串
{
	assert(pos <= _size);
	size_t len = strlen(str);
	if (_size + len > _capacity)
	{//扩容
		reserve(_size + len);
	}
	for (int i = _size;i >= (int)pos;i--)//挪数据
	{
		_str[i + len] = _str[i];
	}
	strncpy(_str + pos, str, len);//插入str
	_size += len;
	return *this;
}

14、push_back函数与append函数

声明:

void push_back(const char c);//尾插字符
void append(const char* str);//尾插字符串

定义:

void lsx::string::push_back(const char c)//尾插字符
{
	insert(size(), c);
}
void lsx::string::append(const char* str)//尾插字符串
{
	assert(str);
	insert(size(), str);
}

15、operator+=函数

声明:

string& operator+=(const char c);//string+=char
string& operator+=(const char* str);//string+=char*
string& operator+=(const string& str);//string+=string

定义:

lsx::string& lsx::string::operator+=(const char c)//string+=char
{
	push_back(c);
	return *this;
}
lsx::string& lsx::string::operator+=(const char* str)//string+=char*
{
	append(str);
	return *this;
}
lsx::string& lsx::string::operator+=(const string& str)//string+=string
{
	append(str._str);
	return *this;
}

16、operator[]函数

声明:

char& operator[](size_t i);//随机访问
const char& operator[](size_t i)const;//随机访问

定义:

char& lsx::string::operator[](size_t i)//随机访问
{
	assert(i <= _size);
	return _str[i];
}
const char& lsx::string::operator[](size_t i)const//随机访问
{
	assert(i <= _size);
	return _str[i];
}

17、c_str函数、size函数与capacity函数

声明:

const char* c_str()const;//返回_str
size_t size()const;//返回_size
size_t capacity()const;//返回_capacity

定义:

const char* lsx::string::c_str()const//返回_str
{
	return _str;
}
size_t lsx::string::size()const//返回_size
{
	return _size;
}
size_t lsx::string::capacity()const//返回_capacity
{
	return _capacity;
}

18、比较运算符重载

声明:

bool operator<(const string& str)const;//string<string
bool operator==(const string& str)const;//string==string
bool operator<=(const string& str)const;//string<=string
bool operator>(const string& str)const;//string>string
bool operator>=(const string& str)const;//string>=string
bool operator!=(const string& str)const;//string!=string

定义:

bool lsx::string::operator<(const string& str)const//string<string
{
	return strcmp(_str, str._str) < 0;
}
bool lsx::string::operator==(const string& str)const//string==string
{
	return strcmp(_str, str._str) == 0;
}
bool lsx::string::operator<=(const string& str)const//string<=string
{
	return *this < str || *this == str;
}
bool lsx::string::operator>(const string& str)const//string>string
{
	return !(*this <= str);
}
bool lsx::string::operator>=(const string& str)const//string>=string
{
	return !(*this < str);
}
bool lsx::string::operator!=(const string& str)const//string!=string
{
	return !(*this == str);
}

19、find函数

声明:

size_t find(const char& c, size_t pos = 0);//找c第一次出现的位置
size_t find(const char* str, size_t pos = 0);//找str第一次出现的位置

定义:

size_t lsx::string::find(const char& c, size_t pos)//找c第一次出现的位置
{
	assert(pos < _size);
	for (int i = pos;i < _size;i++)
	{
		if (_str[i] == c)
		{
			return i;
		}
	}
	return npos;
}
size_t lsx::string::find(const char* str, size_t pos)//找str第一次出现的位置
{
	assert(pos < _size);
	char* tmp = strstr(_str + pos, str);
	if (tmp == nullptr)
	{
		return npos;
	}
	return tmp - _str;
}

20、operator<<函数

声明:

ostream& operator<<(ostream& cout, const string& str);//cout<<string

定义:

ostream& lsx::operator<<(ostream& cout, const string& str)//cout<<string
{
	for (auto a : str)
	{
		cout << a;
	}
	return cout;
}

21、operator>>函数

声明:

istream& operator>>(istream& in, string& str);//cin>>string

定义:

istream& lsx::operator>>(istream& in, string& str)//cin>>string
{
	char buff[129];
	size_t i = 0;
	char ch=cin.get();//只有用get()才能读到空字符或者换行字符
	while (ch != ' ' && ch != '\n')//读到空字符或者换行符为止
	{
		buff[i++] = ch;
		if (i == 128)//满128个再放入字符串,避免多次开辟空间
		{
			buff[129] = '\0';
			str += buff;
			i = 0;
		}
		ch = cin.get();
	}
	if (i != 0)//把buff里剩余的全部放入字符串
	{
		buff[i] = '\0';
		str += buff;
	}
	return cin;
}



如有错误,欢迎指正,谢谢。

完结。。

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6