Tuesday, June 19, 2007

STL vector容器介绍(转载)

在CSDN上看到一篇关于介绍vector的文章,觉得还不错,里面对于vector的成员函
数和简单用法介绍的还蛮清楚的,于是转过来作为备用,方便以后查找vector的一
些方法。(一下内容转自CSDN中masterlee的专栏)
  
  介绍std::vector,并且讨论它在STL中的算法和条件函数remove_if()。
  
  介绍
  这篇文章的目的是为了介绍std::vector,如何恰当地使用它们的成员函数等
操作。本文中还讨论了条件函数和函数指针在迭代算法中使用,如在 remove_if()
和for_each()中的使用。通过阅读这篇文章读者应该能够有效地使用vector容器,
而且应该不会再去使用C类型的动态数组了。
  
  Vector总览
  vector是C++标准模板库中的部分内容,它是一个多功能的,能够操作多种数
据结构和算法的模板类和函数库。vector之所以被认为是一个容器,是因为它能够
像容器一样存放各种类型的对象,简单地说,vector是一个能够存放任意类型的动
态数组,能够增加和压缩数据。
  为了可以使用vector,必须在你的头文件中包含下面的代码:#include
  vector属于std命名域的,因此需要通过命名限定,如下完成你的代码:
   using std::vector;
   vector vInts;
  或者连在一起,使用全名:std::vector vInts;
  建议使用全局的命名域方式:using namespace std;
  在后面的操作中全局的命名域方式会造成一些问题。vector容器提供了很多接
口,在下面的表中列出vector的成员函数和操作。
  
  Vector成员函数
  函数 表述
  c.assign(beg,end):将[beg; end)区间中的数据赋值给c。
  c.assign(n,elem):将n个elem的拷贝赋值给c。
  c.at(idx):传回索引idx所指的数据,如果idx越界,抛出out_of_range。
  c.back():传回最后一个数据,不检查这个数据是否存在。
  c.begin():传回迭代器重的可一个数据。
  c.capacity():返回容器中数据个数。
  c.clear():移除容器中所有数据。
  c.empty():判断容器是否为空。
  c.end():指向迭代器中的最后一个数据地址。
  c.erase(pos):删除pos位置的数据,传回下一个数据的位置。
  c.erase(beg,end):删除[beg,end)区间的数据,传回下一个数据的位置。
  c.front():传回地一个数据。
  get_allocator:使用构造函数返回一个拷贝。
  c.insert(pos,elem):在pos位置插入一个elem拷贝,传回新数据位置。
  c.insert(pos,n,elem):在pos位置插入n个elem数据。无返回值。
  c.insert(pos,beg,end):在pos位置插入在[beg,end)区间的数据。无返回值。
  c.max_size():返回容器中最大数据的数量。
  c.pop_back():删除最后一个数据。
  c.push_back(elem):在尾部加入一个数据。
  c.rbegin():传回一个逆向队列的第一个数据。
  c.rend():传回一个逆向队列的最后一个数据的下一个位置。
  c.resize(num):重新指定队列的长度。
  c.reserve():保留适当的容量。
  c.size():返回容器中实际数据的个数。
  c1.swap(c2):将c1和c2元素互换。
  swap(c1,c2):同上操作。
  vector c:创建一个空的vector。
  vector c1(c2):复制一个vector。
  vector c(n):创建一个vector,含有n个数据,数据均已缺省构造产生。
  vector c(n, elem):创建一个含有n个elem拷贝的vector。
  vector c(beg,end):创建一个以[beg;end)区间的vector。
  c.~ vector ():销毁所有数据,释放内存。
  
  Vector操作
  函数 描述
  operator[]:返回容器中指定位置的一个引用。
  
  创建一个vector
  vector容器提供了多种创建方法,下面介绍几种常用的。创建一个Widget类型
的空的vector对象:
  vector vWidgets;
  
  创建一个包含500个Widget类型数据的vector:
  vector vWidgets(500);
  
  创建一个包含500个Widget类型数据的vector,并且都初始化为0:
  vector vWidgets(500, Widget(0));
  
  创建一个Widget的拷贝:
  vector vWidgetsFromAnother(vWidgets);
  
  向vector添加一个数据
  vector添加数据的缺省方法是push_back()。push_back()函数表示将数据添加
到vector的尾部,并按需要来分配内存。例如:向vector中添加10个数据,需要如
下编写代码:
  for(int i= 0;i<10; i++)
   vWidgets.push_back(Widget(i));
  
  获取vector中制定位置的数据
  很多时候我们不必要知道vector里面有多少数据,vector里面的数据是动态分
配的,使用push_back()的一系列分配空间常常决定于文件或一些数据源。如果你
想知道vector存放了多少数据,你可以使用empty()。获取vector的大小,可以使
用size()。例如,如果你想获取一个vector v的大小,但不知道它是否为空,或者
已经包含了数据,如果为空想设置为-1,你可以使用下面的代码实现:
  int nSize = v.empty() ? -1 : static_cast(v.size());
  
  访问vector中的数据
  使用两种方法来访问vector。
  1、 vector::at()
  2、 vector::operator[]
  operator[]主要是为了与C语言进行兼容。它可以像C语言数组一样操作。但at
()是我们的首选,因为at()进行了边界检查,如果访问超过了 vector的范围,将
抛出一个例外。由于operator[]容易造成一些错误,所有我们很少用它,下面进行
验证一下:
  
  分析下面的代码:
  vector v;
  v.reserve(10);
  for(int i=0; i<7; i++)
   v.push_back(i);
  try
  {
   int iVal1 = v[7]; // not bounds checked - will not throw
   int iVal2 = v.at(7); // bounds checked - will throw if out of range
  }
  catch(const exception& e)
  {
   cout << e.what();
  }
  我们使用reserve()分配了10个int型的空间,但并不没有初始化。也就是说
vector容器中前7个元素已经被初始化,分别是0、1、2、 3、4、5、6;但其后三
个元素只是分配了int型空间,但是并没有被初始化。
  你可以在这个代码中尝试不同条件,观察它的结果,但是无论何时使用at(),
都是正确的。
  
  删除vector中的数据
  vector能够非常容易地添加数据,也能很方便地取出数据,同样vector提供了
erase(),pop_back(),clear()来删除数据,当你删除数据的时候,你应该知道要
删除尾部的数据,或者是删除所有数据,还是个别的数据。在考虑删除等操作之前
让我们静下来考虑一下在STL中的一些应用。
  
  Remove_if()算法
  现在我们考虑操作里面的数据。如果要使用remove_if(),我们需要在头文件
中包含如下代码::
  #include
  Remove_if()有三个参数:
  1、 iterator _First:指向第一个数据的迭代指针。
  2、 iterator _Last:指向最后一个数据的迭代指针。
  3、 predicate _Pred:一个可以对迭代操作的条件函数。
  
  条件函数
  条件函数是一个按照用户定义的条件返回是或否的结果,是最基本的函数指
针,或者是一个函数对象。这个函数对象需要支持所有的函数调用操作,重载
operator()()操作。remove_if()是通过unary_function继承下来的,允许传递数
据作为条件。
  例如,假如你想从一个vector中删除匹配的数据,如果字串中包含了一个值,
从这个值开始,从这个值结束。首先你应该建立一个数据结构来包含这些数据,类
似代码如下:
  #include
  enum findmodes
  {
   FM_INVALID = 0,
   FM_IS,
   FM_STARTSWITH,
   FM_ENDSWITH,
   FM_CONTAINS
  };
  typedef struct tagFindStr
  {
   UINT iMode;
   CString szMatchStr;
  }FindStr;
  typedef FindStr* LPFINDSTR;
  
  然后处理条件判断:
  class FindMatchingString : public std::unary_function
  {
  public:
  
   FindMatchingString(const LPFINDSTR lpFS) : m_lpFS(lpFS) {}
   bool operator()(CString& szStringToCompare) const
   {
   bool retVal = false;
   switch(m_lpFS->iMode)
   {
   case FM_IS:
   {
   retVal = (szStringToCompare == m_lpFDD->szMatchStr);
   break;
   }
   case FM_STARTSWITH:
   {
   retVal = (szStringToCompare.Left(m_lpFDD->szMatchStr.GetLength())
   == m_lpFDD->szWindowTitle);
   break;
   }
   case FM_ENDSWITH:
   {
   retVal = (szStringToCompare.Right(m_lpFDD->szMatchStr.GetLength())
  
   == m_lpFDD->szMatchStr);
   break;
   }
   case FM_CONTAINS:
   {
   retVal = (szStringToCompare.Find(m_lpFDD->szMatchStr) != -1);
   break;
   }
   }
   return retVal;
   }
  private:
   LPFINDSTR m_lpFS;
  };
  通过这个操作你可以从vector中有效地删除数据:
  // remove all strings containing the value of
  // szRemove from vector vs.
  FindStr fs;
  fs.iMode = FM_CONTAINS;
  fs.szMatchStr = szRemove;
  vs.erase(std::remove_if(vs.begin(), vs.end(),
FindMatchingString(&fs)), vs.end());
  
  Remove_if()能做什么?
  你可能会疑惑,对于上面那个例子在调用remove_if()的时候还要使用erase()
呢?这是因为大家并不熟悉STL中的算法。Remove (),remove_if()等所有的移出操
作都是建立在一个迭代范围上的,那么不能操作容器中的数据。所以在使用
remove_if(),实际上操作的时容器里数据的上面的。思考上面的例子:
  1、 szRemove = "o".
  2、 vs的结果,说明remove_if()实际上是根据条件对迭代地址进行了修改,
在数据的后面存在一些残余的数据,那些需要删除的数据。剩下的数据的位置可能
不是原来的数据,但他们是不知道的。
  调用erase()来删除那些残余的数据。注意上面例子中通过erase()删除
remove_if()的结果和vs.enc()范围的数据。
  
  压缩一个臃肿的vector
  很多时候大量的删除数据,或者通过使用reserve(),结果vector的空间远远
大于实际需要的。所有需要压缩vector到它实际的大小。 resize()能够增加
vector的大小。Clear()仅仅能够改变缓存的大小,所有的这些对于vector释放内
存等九非常重要了。如何来解决这些问题呢,让我们来操作一下。
  我们可以通过一个vector创建另一个vector。让我们看看这将发生什么。假定
我们已经有一个vector v,它的内存大小为1000,当我们调用size()的时候,它的
大小仅为7。我们浪费了大量的内存。让我们在它的基础上创建一个vector。
  std::vector vNew(v);
  cout << vNew.capacity();
  vNew.capacity()返回的是7。这说明新创建的只是根据实际大小来分配的空
间。现在我们不想释放v,因为我们要在其它地方用到它,我们可以使用swap()将v
和vNew互相交换一下?
   vNew.swap(v);
   cout << vNew.capacity();
   cout << v.capacity();
  有趣的是:vNew.capacity()是1000,而v.capacity()是7。
  现在是达到我的目的了,但是并不是很好的解决方法,我们可以像下面这么写:
   std::vector(v).swap(v);
  你可以看到我们做了什么?我们创建了一个临时变量代替那个命名的,然后使
用swap(),这样我们就去掉了不必要的空间,得到实际大小的v。
  
  结论
  我希望这个文档可以给那些使用STL vector容器的开发者很有价值的参考。我
也希望通过阅读这篇文章你可以放心地使用vector来代替C语言中的数据了。
  
  参考
  Plauger, P.J. Standard C++ Library Reference. February, 2003. MSDN.
  Schildt, Herbert. C++ from the Ground Up, Second Edition. Berkeley:
1998.
  Sutter, Herb. More Exceptional C++. Indianapolis: 2002.

No comments: