Главная              Рефераты - Разное

Правила правой руки 17 Замечания для программистов на c 17 Глава 1 - реферат

Бьярн Страустрап; Введение в язык Си++

Содержание 1

Предисловие 8

Благодарности 8

Заметки для читателя 10

Структура этой книги 10

Замечания по реализации 11

Упражнения 11

Замечания по проекту языка 11

Исторические замечания 12

Эффективность и структура 13

Философские замечания 15

Размышления о программировании на C++ 15

Правила правой руки 17

Замечания для программистов на C 17

Глава 1

Турне по C++ 18

1.1 Введение 18

1.1.1 Вывод 18

1.1.2 Компиляция 19

1.1.3 Ввод 20

1.2 Комментарии 21

1.3 Типы и Описания 21

1.3.1 Основные Типы 21

1.3.2 Производные Типы 23

1.4 Выражения и Операторы 23

1.4.1 Выражения 23

1.4.2 Операторы Выражения 24

1.4.3 Пустой оператор 24

1.4.4 Блоки 24

1.4.5 Операторы if 25

1.4.6 Операторы switch 25

1.4.7 Оператор while 26

1.4.8 Оператор for 26

1.4.9 Описания 27

1.5 Функции 27

1.6 Структура программы 28

1.7 Классы 30

1.8 Перегрузка операций 31

1.9 Ссылки 32

1.10 Конструкторы 33

1.11 Вектора 34

1.12 Inline-подстановка 35

1.13 Производные классы 36

1.14 Еще об операциях 37

1.15 Друзья (friend) 39

1.16 Обобщенные Вектора 40

1.17 Полиморфные Вектора 40

1.18 Виртуальные функции 42

Глава 2

Описания и Константы 43

2.1 Описания 43

2.1.1 Область Видимости 44

2.1.2 Объекты и Адреса (Lvalue) 46

2.1.3 Время Жизни 46

2.2 Имена 47

2.3 Типы 47

2.3.1 Основные Типы 48

2.3.2 Неявное Преобразование Типа 49

2.3.3 Производные Типы 50

2.3.4 Тип void 51

2.3.5 Указатели 51

2.3.6 Вектора 52

2.3.7 Указатели и Вектора 54

2.3.8 Структуры 55

2.3.9 Эквивалентность типов 57

2.3.10 Ссылки 58

2.3.11 Регистры 60

2.4 Константы 61

2.4.1 Целые Константы 61

2.4.2 Константы с Плавающей Точкой 62

2.4.3 Символьные Константы 62

2.4.4 Строки 63

2.4.5 Ноль 64

2.4.6 Const 64

2.4.7 Перечисления 65

2.5 Экономия Пространства 66

2.5.1 Поля 66

2.5.2 Объединения 67

2.6 Упражнения 69

Глава 3

Выражения и операторы 71

3.1 Настольный калькулятор 71

3.1.1 Программа синтаксического разбора 71

3.1.2 Функция ввода 76

3.1.3 Таблица имен 78

3.1.4 Обработка ошибок 80

3.1.5 Драйвер 81

3.1.6 Параметры командной строки 82

3.2 Краткая сводка операций 83

3.2.1 Круглые скобки 85

3.2.2 Порядок вычисления 85

3.2.2 Увеличение и уменьшение* 86

3.2.4 Побитовые логические операции 87

3.2.5 Преобразование типа 88

3.2.6 Свободная память 89

3.3 Сводка операторов 92

3.3.1 Проверки 93

3.3.2 Goto 95

3.4 Комментарии и Выравнивание 96

3.5 Упражнения 97

Глава 4

Функции и Файлы 100

4.1 Введение 100

4.2 Компоновка 101

4.3 Заголовочные Файлы 102

4.3.1 Один Заголовочный Файл 104

4.3.2 Множественные Заголовочные Файлы 107

4.3.3 Скрытие Данных 109

4.4 Файлы как Модули 110

4.5 Как Создать Библиотеку 111

4.6 Функции 112

4.6.1 Описания Функций 112

4.6.2 Определения Функций 112

4.6.3 Передача Параметров 113

4.6.4 Возврат Значения 114

4.6.5 Векторные Параметры 115

4.6.6 Параметры по Умолчанию 116

4.6.7 Перегрузка Имен Функций 117

4.6.8 Незаданное Число Параметров 119

4.6.9 Указатель на Функцию 120

4.7 Макросы 124

4.8 Упражнения 125

Глава 5

Классы 128

5.1 Знакомство и краткий обзор 128

5.2 Классы и Члены 129

5.2.1 Функции Члены 129

5.2.2 Классы 130

5.2.3 Ссылки на Себя 131

5.2.4 Инициализация 132

5.2.5 Очистка 134

5.2.6 Inline 135

5.3 Интерфейсы и Реализации 135

5.3.1 Альтернативные Реализации 136

5.3.2 Законченный Класс 139

5.4 Друзья и Объединения 142

5.4.1 Друзья 142

5.4.2 Уточнение* Имени Члена 144

5.4.3 Вложенные Классы 144

5.4.4 Статические Члены 145

5.4.5 Указатели на Члены 146

5.4.6 Структуры и Объединения 147

5.5 Конструкторы и Деструкторы 149

5.5.1 Предостережение 150

5.5.2 Статическая Память 150

5.5.3 Свободная Память 152

5.5.4 Объекты Класса и Члены 152

5.5.5 Вектора Объектов Класса 154

5.5.6 Небольшие Объекты 155

5.5.7 Предостережение 156

5.5.8 Объекты Переменного Размера 157

5.6 Упражнения 158

Глава 6

Перегрузка Операций 160

6.1 Введение 160

6.2 Функции Операции 161

6.2.1 Бинарные и Унарные Онерации 161

6.2.2 Предопределенные Значения Операций 162

6.2.3 Операции и Определяемые Пользователем Типы 162

6.3 Определяемое Преобразование Типа 163

6.3.1 Конструкторы 164

6.3.2 Операции Преобразования 164

6.3.3 Неоднозначности 166

6.4 Константы 167

6.5 Большие Объеты 167

6.6 Присваивание и Инициализация 168

6.7 Индексирование 170

6.8 Вызов Функции 172

6.9 Класс Строка 173

6.10 Друзья и Члены 177

6.11 Предостережение 177

6.12 Упражнения 178

Глава 7

Производные Классы 181

7.1 Введение 181

7.2 Производные Классы 182

7.2.1 Построение Производного Класса 182

7.2.2 Функции Члены 183

7.2.3 Видимость 184

7.2.4 Указатели 186

7.2.5 Иерархия Типов 187

7.2.6 Конструкторы и Деструкторы 187

7.2.7 Поля Типа 188

7.2.8 Виртуальные Функции 190

7.3 Альтернативные Интерфейсы 192

7.3.1 Интерфейс 192

7.3.2 Реализация 193

7.3.3 Как Этим Пользоваться 194

7.3.4 Обработка Ошибок 196

7.3.5 Обобщенные Классы 197

7.3.6 Ограниченные Интерфейсы 199

7.4 Добавление к Классу 199

7.5 Неоднородные Списки 201

7.6 Законченна Программа 201

7.6.1 Администратор Экрана 201

7.6.2 Библиотека Фигур 203

7.6.3 Прикладная Программа 207

7.7 Свободная Память 209

7.8 Упражнения 210

Глава 8

Потоки 212

8.1 Введение 212

8.2 Вывод 213

8.2.1 Вывод Встроенных Типов 213

8.2.2 Вывод Типов, Определяемых Пользователем 214

8.2.3 Некоторые Подробности Разработки 214

8.2.4 Форматированный Вывод 216

8.2.5 Виртуальная Функция Вывода 218

8.3 Файлы и Потоки 219

8.3.1 Инициализация Потоков Вывода 219

8.3.2 Закрытие Потоков Вывода 220

8.3.3 Открытие Файлов 220

8.3.4 Копирование Потоков 221

8.4 Ввод 221

8.4.1 Ввод Встроенных Типов 221

8.4.2 Состояния Потока 223

8.4.3 Ввод Типов, Определяемых Пользователем 224

8.4.4 Инициализация Потоков Ввода 225

8.5 Работа со Строками 226

8.6 Буферизация 226

8.7 Эффективность 228

8.8 Упражнения 228

1. ВВЕДЕНИЕ 230

2. ДОГОВОРЕННОСТИ О ЛЕКСИКЕ 230

2.1 Комментарии 230

2.2 Идентификаторы (имена) 230

2.3 Ключевые слова 230

2.4 Константы 231

2.4.1 Целые константы 231

2.4.2 Явно заданные длинные константы 231

2.4.3 Символьные константы 231

2.4.4 Константы с плавающей точкой 232

2.4.5 Перечислимые константы 232

2.4.6 Описанные константы 232

2.5 Строки 232

2.6 Харктеристики аппаратного обеспечения 232

3. ЗАПИСЬ СИНТАКСИСА 233

4. ИМЕНА И ТИПЫ 233

4.1 Область видимости 234

4.2 Определения 234

4.3 Компоновка 234

4.4 Классы памяти 235

4.5 Основные типы 236

4.4 Производные типы 236

5. ОБЪЕКТЫ И LVALUE(АДРЕСА) 237

6. ПРЕОБРАЗОВАНИЯ 237

6.1 Символы и целые 237

6.2 Float и double 237

6.3 Плавающие и целые 237

6.4 Указатели и целые 238

6.5 Unsigned 238

6.6 Арифметические преобразования 238

6.7 Преобразования указателей 239

6.8 Преобразования ссылок 239

7. ВЫРАЖЕНИЯ 239

7.1 Основные выражения 240

7.2 Унарные операции 241

7.2.1 Увеличение и Уменьшение 242

7.2.2 Sizeof 242

7.2.3 Явное Преобразование Типа 243

7.2.4 Свободная Память 243

7.3 Мультипликативные операции 244

7.4 Аддитивные операции 244

7.5 Операции сдвига 245

7.6 Операции отношения 245

7.7 Операции равенства 246

7.8 Операция побитовое И 246

7.9 Операция побитовое исключающее ИЛИ 246

7.10 Операция побитовое включающее ИЛИ 246

7.11 Операция логическое И 246

7.12 Операция логическое ИЛИ 246

7.13 Условная операция 247

7.14 Операции присваивания 247

7.15 Операция запятая 247

7.16 Перегруженные операции 248

7.16.1 Унарные операции 248

7.16.2 Бинарные операции 248

7.16.3 Особые операции 248

8. ОПИСАНИЯ 249

8.1 Спецификаторы класса памяти 249

8.2 Спецификаторы Типа 250

8.3 Описатели 251

8.4 Смысл описателей 252

8.4.1 Примеры 254

8.5 Описания классов 256

8.5.1 Статические члены 257

8.5.2 Функции члены 257

8.5.3 Производные классы 259

8.5.4 Виртуальные функции 259

8.5.5 Конструкторы 260

8.5.6 Преобразования 261

8.5.7 Деструкторы 261

8.5.8 Видимость имен членов 261

8.5.9 Друзья (friends) 262

8.5.10 Функция операция 263

8.5.11 Структуры 263

8.5.12 Объединения 263

8.5.13 Поля бит 263

8.5.14 Вложенные классы 264

8.6 Инициализация 264

8.6.1 Список инициализаторов 265

8.6.2 Классовые объекты 266

8.6.3 Ссылки 266

8.6.4 Массивы символов 267

8.7 Имена типов 267

8.8 Определение типа typedef 268

8.9 Перегруженные имена функций 269

8.10 Описание перечисления 270

8.11 Описание Asm 270

9. ОПЕРАТОРЫ 271

9.1 Оператор выражение 271

9.2 Составной оператор, или блок 271

9.3 Условный оператор 271

9.4 Оператор while 271

9.5 Оператор do 272

9.6 Оператор for 272

9.7 Оператор switch 273

9.8 Оператор break 273

9.9 Оператор continue 274

9.10 Оператор return 274

9.11 Оператор goto 274

9.12 Помеченные операторы 274

9.13 Пустой оператор 274

9.14 Оператор delete 275

9.15 Оператор asm 275

10. ВНЕШНИЕ ОПРЕДЕЛЕНИЯ 275

10.1 Определения функций 275

10.2 Определения внешних данных 276

11. ПРАВИЛА ОБЛАСТИ ВИДИМОСТИ 276

12. КОМАНДНЫЕ СТРОКИ КОМПИЛЯТОРА 276

12.1 Замена идентификаторов 277

12.2 Включение файлов 277

12.3 Условная компиляция 277

12.4 Управление строкой 278

13. НЕЯВНЫЕ ОПИСАНИЯ 278

14. ОБЗОР ТИПОВ 278

14.1 Классы 278

14.2 Функции 278

14.3 Массивы, указатели и индексирование 279

14.4 Явные преобразования указателей 279

15. КОНСТАНТНЫЕ ВЫРАЖЕНИЯ 280

16. СООБРАЖЕНИЯ МОБИЛЬНОСТИ 281

17. СВОБОДНАЯ ПАМЯТЬ 281

18. КРАТКОЕ ИЗЛОЖЕНИЕ СИНТАКСИСА 282

18.1 Выражения 282

18.2 Описания 283

18.3 Операторы 285

18.4 Внешние определения 286

18.5 Препроцессор 286

19. ОТЛИЧИЯ ОТ "СТАРОГО C" 286

19.1 Расширения 286

Предисловие

Язык формирует наш способ мышления

и определяет, о чем мы можем мыслить.

Б.Л. Ворф

C++ - универсальный язык программирования, задуманный так, чтобы

сделать программирование более приятным для серьезного

программиста. За исключением второстепенных деталей C++ является

надмножеством языка программирования C. Помимо возможностей,

которые дает C, C++ предоставляет гибкие и эффективные средства

определения новых типов. Используя определения новых типов, точно

отвечающих концепциям приложения, программист может разделять

разрабатываемую программу на легко поддающиеся контролю части.

Такой метод построения программ часто называют абстракцией данных.

Информация о типах содержится в некоторых объектах типов,

определенных пользователем. Такие объекты просты и надежны в

использовании в тех ситуациях, когда их тип нельзя установить на

стадии компиляции. Программирование с применением таких объектов

часто называют объектно-ориентированным. При правильном

использовании этот метод дает более короткие, проще понимаемые и

легче контролируемые программы.

Ключевым понятием C++ является класс. Класс - это тип,

определяемый пользователем. Классы обеспечивают скрытие данных,

гарантированную инициализацию данных, неявное преобразование типов

для типов, определенных пользователем, динамическое задание типа,

контролируемое пользователем управление памятью и механизмы

перегрузки операций. C++ предоставляет гораздо лучшие, чем в C,

средства выражнения модульности программы и проверки типов. В языке

есть также усовершенствования, не связанные непосредственно с

классами, включающие в себя символические константы, inline-

подстановку функций, параметры функции по умолчанию, перегруженные

имена функций, операции управления свободной памятью и ссылочный

тип. В C++ сохранены возможности языка C по работе с основными

объектами аппаратного обеспечения (биты, байты, слова, адреса и

т.п.). Это позволяет весьма эффективно реализовывать типы,

определяемые пользователем.

C++ и его стандартные библиотеки спроектированы так, чтобы

обеспечивать переносимость. Имеющаяся на текущий момент реализация

языка будет идти в большинстве систем, поддерживающих C. Из C++

программ можно использовать C библиотеки, и с C++ можно

использовать большую часть инструментальных средств, поддерживающих

программирование на C.

Эта книга предназначена главным образом для того, чтобы помочь

серьезным программистам изучить язык и применять его в

нетривиальных проектах. В ней дано полное описание C++, много

примеров и еще больше фрагментов программ.

Благодарности

C++ никогда бы не созрел без постоянного использования,

предложений и конструктивной критики со стороны многих друзей и

- стр 9 -

коллег. Том Карджил, Джим Коплин, Сту Фельдман, Сэнди Фрэзер, Стив

Джонсон, Брайэн Керниган, Барт Локанти, Дуг МакИлрой, Дэннис Риччи,

Лэрри Рослер, Джерри Шварц и Джон Шопиро подали важные для развития

языка идеи. Дэйв Пресотто написал текущую реализацию библиотеки

потоков ввода/вывода.

Кроме того, в развитие C++ внесли свой вклад сотни людей, которые

присылали мне предложения по усовершенствованию, описания

трудностей, с которыми они сталкивались, и ошибки компилятора.

Здесь я могу упомянуть лишь немногих из них: Гэри Бишоп, Эндрю

Хьюм, Том Карцес, Виктор Миленкович, Роб Мюррэй, Леони Росс, Брайэн

Шмальт и Гарри Уокер.

В издании этой книги мне помогли многие люди, в частности, Джон

Бентли, Лаура Ивс, Брайэн Керниган, Тэд Ковальски, Стив Махани,

Джон Шопиро и участники семинара по C++, который проводился в Bell

Labs, Колумбия, Огайо, 26-27 июня 1985 года.

Мюррэй Хилл, Нью Джерси Бьярн Страустрап

Заметки для читателя

"О многом,"-молвил Морж,-"Пришла

пора поговорить."

Л. Кэррол

В этой главе содержится обзор книги, список библиографических

ссылок и некоторые замечания по C++ вспомогательного характера.

Замечания касаются истории C++, идей, оказавших влияние на

разработку C++, и мыслей по поводу программирования на C++. Эта

глава не является введением: замечания не обязательны для

понимания последующих глав, и некоторые из них предполагают знание

C++.

Структура этой книги

Глава 1 - это короткое турне по основным особенностям C++,

предназначенное для того, чтобы дать читателю почувствовать язык.

Программисты на C первую половину главы могут прочитать очень

быстро; она охватывает главным образом черты, общие для C и C++. Во

второй главе описаны средства определения новых типов в C++;

начинающие могут отложить более подробное изучение этого до того,

как прочтут Главы 2, 3 и 4.

В Главах 2, 3 и 4 описываются средства C++, не включенные в

определение новых типов: основные типы, выражения и структуры

управления в C++ программах. Другими словами, в них описывается

подмножество C++, которое по существу является языком C.

Рассмотрение в них проводится гораздо подробнее, но полную

информацию можно найти только в справочном руководстве.

В Главах 5, 6 и 7 описываются средства C++ по описанию новых

типов, особенности языка, не имеющие эквивалента в C. В Главе 5

приводится понятие базового класса, и показывается, как можно

инициализировать объекты типа, определенного пользователем,

обращаться к ним и, наконец, убирать их. В Главе 6 объясняется, как

для определенного пользователем типа определять унарные и бинарные

операции, как задавать преобразования между типами, определенными

пользователем, и как как задавать то, каким образом должно

обрабатываться каждое создание, уничтожение и копирование значения

определенного пользователем типа. Глава 7 описывает концепцию

производных классов, которая позволяет программисту строить более

сложные классы из более простых, обеспечивать альтернативные

интерфейсы класса и работать с объектами безопасным и не требующим

беспокоиться о типе способом в тех ситуациях, когда типы объектов

не могут быть известны на стадии компиляции.

В Главе 8 представлены классы ostream и istream, предоставляемые

стандартной библиотекой для осуществления ввода-вывода. Эта глава

имеет двоякую цель: в ней представлены полезные средства, что

одновременно является реальным примером использования C++.

И, наконец, в книгу включено справочное руководство по C++.

Ссылки на различные части этой книги даются в форме #2.3.4 (Глава

2 подраздел 3.4). Глава с - это справочное руководство; например,

#с.8.5.5.

- стр 11 -

Замечания по реализации

Во время написания этой книги все реализации C++ использовали

версии единственного интерфейсного компилятора#. Он используется на

многих архитектурах, включая действующие версии системы

операционной системы UNIX на AT&T 3B, DEC VAX, IBM 370 и Motorolla

68000. Фрагменты программ, которые приводятся в этой книге, взяты

непосредственно из исходных файлов, которые компилировались на 3B

в UNIX System V версии 2 [15], VAX11/750 под 8-ой Редакцией UNIX

[16] и CCI Power 6/32 под BSD4.2 UNIX [17]. Язык, описанный в этой

книге, - это "чистый C++", но имеющиеся на текущий момент

компиляторы реализуют большое число "анахронизмов" (описанных в

#с.15.3), которые должны способствовать переходу от C к C++.

Упражнения

Упражнения находятся в конце глав. Все упражнения главным образом

типа напишите-программу. Для решения всегда пишите такую прогармму,

которая будет компилироваться и работать по меньшей мере на

нескольких тестовых случаях. Упражнения различаются в основном по

сложности, поэтому они помечены оценкой степени сложности. Шкала

экспоненциальная, так что если на упражение (*1) вам потребовалось

пять минут, то упражнение (*2) вам может потребоваться час, а на

(*3) - день. Время, которое требуется на то, чтобы написать и

оттестировать программу, зависит больше от опыта читателя, нежели

от самого упражения. Упражнение (*1) может отнять день, если для

того, чтобы запустить ее, читателю сначала придется знакомиться с

новой вычислительной системой. С другой стороны, тот, у кого под

рукой окажется нужный набор программ, может сделать упражнение (*5)

за час. В качестве источника упражнений к Главам 2-4 можно

использовать любую книгу по C. У Ахо и др. [1] приведено большое

количество общих структур данных и алгоритмов втерминах абстрактных

типов данных. Эту книгу также может служить источником упражнений к

Главам 5-7. Однако языку, который в этой книге использовался,

недостает как функций членов, так и производных классов. Поэтому

определенные пользователем типы часто можно выражать в C++ более

элегантно.

Замечания по проекту языка

Существенным критерием при разработке языка была простота; там,

где возникал выбор между упрощением руководства по языку и другой

документации и упрощением компилятора, выбиралось первое. Огромное

значение также придавалось совместимости с C; это помешало удалить

синтаксис C.

В C++ нет типов данных высокого уровня и нет первичных операций

высокого уровня. В нем нет, например, матричного типа с операцией

обращения или типа строка с операцией конкатенации. Если

пользователю понадобятся подобные типы, их можно определить в самом

____________________

# C++ можно купить в AT&T, Software Sales and Marketing, PO Box

25000, Greensboro, NC 27420, USA (телефон 800-828-UNIX) или в ваших

местных организациях, осуществляющих продажу Системы UNIX. (прим.

автора)

- стр 12 -

языке. По сути дела, основное, чем занимается программирование на

C++, - это определение универсальных и специально-прикладных типов.

Хорошо разработанный тип, определенный пользователем, отличается от

встроенного типа только способом определения, но не способом

использования.

Исключались те черты, которые могли бы повлечь дополнительные

расходы памяти или времени выполнения. Например, мысли о том, чтобы

сделать необходимым храние в каждом объекте "хозяйственной"

информации, были отвергнуты; если пользователь описывает структуру,

состоящую из двух 16-битовых величин, то структура поместится в 32-

битовый регистр.

C++ проектировался для использования в довольно традиционной

среде компиляции и выполнения, среде программирования на C в

системе UNIX. Средства обработки особых ситуаций и параллельного

программирования, требующие нетривиальной загрузки и поддержки в

процессе выполнения, не были включены в C++. Вследствие этого

реализация C++ очень легко переносима. Однако есть полные основания

использовать C++ в среде, где имеется гораздо более существенная

поддержка. Такие средства, как динамическая загрузка, пошаговая

трансляция и база данных определений типов могут с пользой

применяться без воздействия на язык.

Типы и средства скрытия данных в C++ опираются на проводимый во

время компиляции анализ программ с целью предотвращения случайного

искажения данных. Они не обеспечивают секретности или защиты от

умышленного нарушения правил. Однако эти средства можно

использовать без ограничений, что не приводит к дополнительным

расходам времени на выполнение или пространства памяти.

Исторические замечания

Безусловно, C++ восходит главным образом к C [7]. C сохранено как

подможество, поэтому сделанного в C акцента на средствах низкого

уровня достаточно, чтобы справляться с самыми насущными задачами

системного программирования. C, в свою очередь, многим обязано

своему предшественнику BCPL [9]; на самом деле, комментарии //

(заново) введены в C++ из BCPL. Если вы знаете BCPL, то вы

заметите, что в C++ по-прежнему нет VALOF блока. Еще одним

источником вдохновения послужил язык Simula67 [2,3]; из него была

позаимствована концепция класса (вместе с производными классами и

функциями членами). Это было сделано, чтобы способствовать

модульности через использование виртуальных функций. Возможности

C++ по перегрузке операций и свобода в расположении описаний везде,

где может встречаться оператор, похожи на Алгол68 [14].

Название C++ - изобретение совсем недавнее (лета 1983его). Более

ранние версии языка использовались начиная с 1980ого и были

известны как "C с Классами". Первоначально язык был придуман

потому, что автор хотел написать модели, управляемые прерываниями,

для чего был бы идеален Simula67, если не принимать во внимание

эффективность. "C с Классами" использовался для крупных проектов

моделирования, в которых строго тестировались возможности

написания программ, требующих минимального (только) пространства

памяти и времени на выполнение. В "C с Классами" не хватало

перегрузки операций, ссылок, виртуальных функций и многих деталей.

C++ был впервые введен за пределами исследовательской группы автора

- стр 13 -

в июле 1983его; однако тогда многие особенности C++ были еще не

придуманы.

Название C++ выдумал Рик Масситти. Название указывает на

эволюционную природу перехода к нему от C. "++" - это операция

приращения в C. Чуть более короткое имя C+ является синтаксической

ошибкой; кроме того, оно уже было использовано как совсем другого

языка. Знатоки семантики C находят, что C++ хуже, чем ++C. Названия

D язык не получил, поскольку он является расширением C и в нем не

делается попыток исцеляться от проблем путем выбрасывания

различных особенностей. Еще одну интерпретацию названия C++ можно

найти в приложении к Оруэллу [8].

Изначально C++ был разработан, чтобы автору и его друзьям не

приходилось программировать на ассемблере, C или других современных

языках высокого уровня. Основным его предназначением было сделать

написание хороших программ более простым и приятным для отдельного

программиста. Плана разработки C++ на бумаге никогда не было;

проект, документация и реализация двигались одновременно.

Разумется, внешний интерфейс C++ был написан на C++. Никогда не

существовало "Проекта C++" и "Комитета по разработке C++". Поэтому

C++ развивался и продолжает развиваться во всех направлениях чтобы

справляться со сложностями, с которыми сталкиваются пользователи, а

также в процессе дискуссий автора с его друзьями и коллегами.

В качестве базового языка для C++ был выбран C, потому что он (1)

многоцелевой, лаконичный и относительно низкого уровня; (2)

отвечает большинству задач системного программирования; (3) идет

везде и на всем; и (4) пригоден в среде программирования UNIX. В C

есть свои сложности, но в наспех спроектированном языке тоже были

бы свои, а сложности C нам известны. Самое главное, работа с C

позволила "C с Классами" быть полезным (правда, неудобным)

инструментом в ходе первых месяцев раздумий о добавлении к C

Simula-образных классов.

C++ стал использоваться шире, и по мере того, как возможности,

предоставляемые им помимо возможностей C, становились все более

существенными, вновь и вновь поднимался вопрос о том, сохранять ли

совместимость с C. Ясно, что отказавшись от определенной части

наследия C можно было бы избежать ряда проблем (см., например,

Сэти [12]). Это не было сделано, потому что (1) есть миллионы строк

на C, которые могли бы принести пользу в C++ при условии, что их не

нужно было бы полностью переписывать с C на C++; (2) есть сотни

тысяч строк библиотечных функций и сервисных программ, написанных

на C, которые можно было бы использовать из или на C++ при условии,

что C++ полностью совместим с C по загрузке и синтаксически очень

похож на C; (3) есть десятки тысяч программистов, которые знают C,

и которым, поэтому, нужно только научиться использовать новые

особенности C++, а не заново изучать его основы; и (4), поскольку

C++ и C будут использоваться на одних и тех же системах одними и

теми же людьми, отличия должны быть либо очень большими, либо очень

маленькими, чтобы свести к минимуму ошибки и недоразумения. Позднее

была проведена проверка определения C++, чтобы удостовериться в

том, что любая конструкциия, допустимая и в C и в C++,

действительно означает в обоих языках одно и то же.

Язык C сам эволюционировал за последние несколько лет, частично

под влиянием развития C++ (см. Ростлер [11]). Предварительный

грубый ANSI стандарт C [10] содержит синтаксис описаний функций,

заимствованный из "C с Классами". Заимствование идей идет в обе

стороны; например, указатель void* был придуман для ANSI C и

- стр 14 -

впервые реализован в C++. Когда ANSI стандарт разовьется несколько

дальше, придет время пересмотреть C++, чтобы удалить необоснованную

несовместимость. Будет, например, модернизирован препроцессор

(#с.11), и нужно будет, вероятно, отрегулировать правила

осуществления плавающей арифметики. Это не должно оказаться

болезненным, и C и ANSI C очень близки к тому, чтобы стать

подмножествами C++ (см. #с.11).

Эффективность и структура

C++ был развит из языка программирования C и за очень немногими

исключениями сохраняет C как подмножество. Базовый язык, C

подмножество C++, спроектирован так, что имеется очень близкое

соответствие между его типами, операциями и операторами и

компьютерными объектами, с которыми непосредственно приходится

иметь дело: числами, символами и адресами. За исключением операций

свободной памяти new и delete, отдельные выражения и операторы C++

обычно не нуждаются в скрытой поддержке во время выполнения или

подпрограммах.

В C++ используются те же последовательности вызова и возврата из

функций, что и в C. В тех случаях, когда даже этот довольно

эффективный механизм является слишком дорогим, C++ функция может

быть подставлена inline, удовлетворяя, таким образом, соглашению о

записи функций без дополнительных расходов времени выполнения.

Одним из первоначальных предназначений C было применение его

вместо программирования на ассемблере в самых насущных задачах

системного программирования. Когда проектировался C++, были приняты

меры, чтобы не ставить под угрозу успехи в этой области. Различие

между C и C++ состоит в первую очередь в степени внимания,

уделяемого типам и структурам. C выразителен и снисходителен. C++

еще более выразителен, но чтобы достичь этой выразительности,

программист должен уделить больше внимания типам объектов. Когда

известны типы объектов, компилятор может правильно обрабатывать

выражения, тогда как в противном случае программисту пришлось бы

задавать действия с мучительными подробностями. Знание типов

объектов также позволяет компилятору обнаруживать ошибки, которые в

противном случае остались бы до тестирования. Заметьте, что

использование системы типов для того, чтобы получить проверку

параметров функций, защитить данные от случайного искажения, задать

новые операции и т.д., само по себе не увеличивает расходов по

времени выполнения и памяти.

Особое внимание, уделенное при разработке C++ структуре,

отразилось на возрастании масштаба программ, написанных со времени

разработки C. Маленькую программу (меньше 1000 строк) вы можете

заставить работать с помощью грубой силы, даже нарушая все правила

хорошего стиля. Для программ больших размеров это не совсем так.

Если программа в 10 000 строк имеет плохую структуру, то вы

обнаружите, что новые ошибки появляются так же быстро, как

удаляются старые. C++ был разработан так, чтобы дать возможность

разумным образом структурировать большие программы таким образом,

чтобы для одного человека не было непомерным справляться с

программами в 25 000 строк. Существуют программы гораздо больших

размеров, однако те, которые работают, в целом, как оказывается,

состоят из большого числа почти независимых частей, каждая из

которых намного ниже указанных пределов. Естественно, сложность

- стр 15 -

написания и поддержки программы зависит от сложности разработки, а

не просто от числа строк текста программы, так что точные цифры, с

помощью которых были выражены предыдущие соображения, не следует

воспринимать слишком серьезно.

Не каждая часть программы, однако, может быть хорошо

структурирована, независима от аппаратного обеспечения, легко

читаема и т.п. C++ обладает возможностями, предназначенные для

того, чтобы непосредственно и эффективно работать с аппаратными

средствами, не беспокоясь о безопасности или простоте понимания. Он

также имеет возможности, позволяющие скрывать такие программы за

элегантными и надежными интерфейсами.

В этой книге особый акцент делается на методах создания

универсальных средств, полезных типов, библиотек и т.д. Эти

средства пригодятся как тем программистам, которые пишут небольшие

программы, так и тем, которые пишут большие. Кроме того, поскольку

все нетривиальные программы состоят из большого числа

полунезависимых частей, методы написания таких частей пригодятся и

системным, и прикладным программистам.

У кого-то может появиться подозрение, что спецификация программы

с помощью более подробной системы типов приведет к увеличению

исходных текстов программы. В C++ это не так; C++ программа,

описывающая типы параметров функций, использующая классы и т.д.,

обычно немного короче эквивалентной C программы, в которой эти

средства не используются.

Философские замечания

Язык программирования служит двум связанным между собой целям: он

дает программисту аппарат для задания действий, которые должны быть

выполнены, и формирует концепции, которыми пользуется программист,

размышляя о том, что делать. Первой цели идеально отвечает язык,

который настолько "близок к машине", что всеми основными машинными

аспектами можно легко и просто оперировать достаточно очевидным для

программиста образом. С таким умыслом первоначально задумывался C.

Второй цели идеально отвечает язык, который настолько "близок к

решаемой задаче", чтобы концепции ее решения можно было выражать

прямо и коротко. С таким умыслом предварительно задумывались

средства, добавленные к C для создания C++.

Связь между языком, на котором мы думаем/программируем, и

задачами и решениями, которые мы можем представлять в своем

воображении, очень близка. По этой причине ограничивать свойства

языка только целями исключения ошибок программиста в лучшем случае

опасно. Как и в случае с естественными языками, есть огромная

польза быть по крайней мере двуязычным. Язык предоставляет

программисту набор концептуальных инструментов; если они не

отвечают задаче, то их просто игнорируют. Например, серьезные

ограничения концепции указателя заставляют программиста применять

вектора и целую арифметику, чтобы реализовать структуры, указатели

и т.п. Хорошее проектирование и отсутствие ошибок не может

гарантироваться чисто за счет языковых средств.

Система типов должна быть особенно полезна в нетривиальных

задачах. Действительно, концепция классов в C++ показала себя

мощным концептуальным средством.

- стр 16 -

Размышления о программировании на C++

В идеальном случае подход к разработке программы делится на три

части: вначале получить ясное понимание задачи, потом выделить

ключевые идеи, входящие в ее решение, и наконец выразить решение в

виде программы. Однако подробности задачи и идеи решения часто

становятся ясны только в результате попытки выразить их в виде

программы - именно в этом случае имеет значение выбор языка

программирования.

В большинстве разработок имеются понятия, которые трудно

представить в программе в виде одного из основных типов или как

функцию без ассоциированных с ней статических данных. Если имеется

подобное понятие, опишите класс, представляющий его в программе.

Класс - это тип; это значит, что он задает поведение объектов его

класса: как они создаются, как может осуществляться работа с ними,

и как они уничтожаются. Класс также задает способ представления

объектов; но на ранних стадиях разработки программы это не является

(не должно являться) главной заботой. Ключом к написанию хорошей

программы является разработка таких классов, чтобы каждый из них

представлял одно основное понятие. Обычно это означает, что

программист должен сосредоточиться на вопросах: Как создаются

объекты этого класса? Могут ли эти объекты копироваться и/или

уничтожаться? Какие действия можно производить над этими объектами?

Если на такие вопросы нет удовлетворительных ответов, то во-первых,

скорее всего, понятие не было "ясно", и может быть неплохо еще

немного подумать над задачей и предлагаемым решением вместо того,

чтобы сразу начинать "программировать вокруг" сложностей.

Проще всего иметь дело с такими понятиями, которые имеют

традиционную математическую форму: числа всех видов, множества,

геометрические фигуры и т.п. На самом деле, следовало бы иметь

стандартные библиотеки классов, представляющих такие понятия, но к

моменту написания это не имело места. C++ еще молод, и его

библиотеки не развились еще до той же степени, что и сам язык.

Понятие не существует в пустоте, всегда есть группы связанных

между собой понятий. Организовать в программе взаимоотношения между

классами, то есть определить точную взаимосвязь между различными

понятиями, часто труднее, чем сначала спланировать отдельные

классы. Лучше, чтобы не получилось неразберихи, когда каждый класс

(понятие) зависит от всех остальных. Рассмотрим два класса, A и B.

Взаимосвязи вроде "A вызывает функции из B", "A создает объекты B"

и "A имеет члены B" редко вызывают большие сложности, а взаимосвязь

вроде "A использует данные из B" обычно можно исключить (просто не

используйте открытые данные-члены). Неприятными, как правило,

являются взаимосвязи, которые по своей природе имеют вид "A есть B

и ...".

Одним из наиболее мощных интеллектуальных средств, позволяющих

справляться со сложностью, является иерархическое упорядочение, то

есть организация связанных между собой понятий в древовидную

структуру с самым общим понятием в корне. В C++ такие структуры

представляются производными классами. Часто можно организавать

программу как множество деревьев (лес?). То есть, программист

задает набор базовых классов, каждый из которых имеет свое

собственное множество производных классов. Для определения набора

действий для самой общей интерпретации понятия (базового класса)

часто можно использовать виртуальные функции (#7.2.8).

Интерпретацию этих действий можно, в случае необходимости,

- стр 17 -

усовершенствовать для отдельных специальных классов (производных

классов).

Естественно, такая организация имеет свои ограничения. В

частности, множество понятий иногда лучше организуется в виде

ациклического графа, в котором понятие может непосредственно

зависеть от более чем одного другого понятия; например, "A есть B и

C и ...". В C++ нет непосредственной поддержки этого, но подобные

связи можно представить, немного потеряв в элегантности и сделав

малость дополнительной работы (#7.2.5).

Иногда для организации понятий некоторой программы оказывается

непригоден даже ациклический граф; некоторые понятия оказываются

взаимозависимыми по своей природе. Если множество взаимозависимых

классов настолько мало, что его легко себе представить, то

циклические зависимости не должны вызвать сложностей. Для

представления множеств взаимозависимых классов с C++ можно

использовать идею friend классов (#5.4.1).

Если вы можете организовать понятия программы только в виде обще-

го графа (не дерева или ациклического направленного графа), и если

вы не можете локализовать взаимные зависимости, то вы, по всей ви-

димости, попали в затруднительное положение, из которого вас не вы-

ручит ни один язык программирования. Если вы не можете представить

какой-либо просто формулируемой зависимости между основными поняти-

ями, то скорее всего справиться с программой не удастся.

Напомню, что большую часть программирования можно легко и

очевидно выполнять, используя только простые типы, структуры

данных, обычные функции и небольшое число классов из стандартной

библиотеки. Весь аппарат, входящий в определение новых типов, не

следует использовать за исключением тех случаев, когда он

действительно нужен.

Вопрос "Как пишут хорошие программы на C++" очень похож на вопрос

"Как пишут хорошую английскую прозу?" Есть два вида ответов:

"Знайте, что вы хотите сказать" и "Практикуйтесь. Подражайте

хорошему языку." Оба совета оказываются подходящими к C++ в той же

мере, сколь и для английского - и им столь же трудно следовать.

Правила Правой Руки (*)

Здесь приводится набор правил, которых вам хорошо бы

придерживаться изучая C++. Когда вы станете более опытны, вы можете

превратить их в то, что будет подходить для вашего рода

деятельности и вашего стиля программирования. Они умышленно сделаны

очень простыми, поэтому подробности в них опущены. Не воспринимайте

их чересчур буквально. Написание хороших программ требует ума,

вкуса и терпения. Вы не собираетесь как следует понять это с самого

начала; поэкспериментируйте!

[1] Когда вы программируете, вы создаете конкретное

представление идей вашего решения некоторой задачи. Пусть

структура отражает эти идеи настолько явно, насколько это

возможно:

[a] Если вы считате "это" отдельным понятием, сделайте его

классом.

____________________

(*) Некоторые легко запоминаемые эмпирические правила, "Правила-

помошники." (прим. перев.)

- стр 18 -

[b] Если вы считате "это" отдельным объектом, сделайте его

объектом некоторого класса.

[c] Если два класса имеют общим нечто существенное, сделайте

его базовым классом. Почти все классы в вашей программе

будут иметь нечто общее; заведите (почти) универсальный

базовый класс, и разработайте его наиболее тщательно.

[2] Когда вы определяете класс, который не реализует

некоторый математический объект, вроде матрицы или

комплексного числа, или тип низкого уровня, вроде связанного

списка, то:

[a] Не используйте глобальные данные.

[b] Не используйте глобальные функции (не члены).

[c] Не используйте открытые данные-члены.

[d] Не используйте друзей, кроме как чтобы избежать [a], [b]

или [c].

[e] Не обращайтесь к данным-членам или другим объектам

непосредственно.

[f] Не помещайте в класс "поле типа"; используйте виртуальные

функции.

[g] Не используйте inline-функции, кроме как средство

существенной оптимизации.

Замечания для программистов на С

Чем лучше кто-нибудь знает C, тем труднее окажется избежать

писания на C++ в стиле C, теряя, тем самым, некоторые возможные

выгоды C++. Поэтому проглядите, пожалуйста, раздел "Отличия от C" в

справочном руководстве (#с.15). Там указывается на области, в

которых C++ позволяет делать что-то лучше, чем C. Макросы (#define)

в C++ почти никогда не бывают необходимы; чтобы определять

провозглашаемые константы, используйте const (#2.4.6) или enum

(#2.4.7), и inline (#1.12) - чтобы избежать лишних расходов на

вызов функции. Старайтесь описывать все функции и типы всех

параметров - есть очень мало веских причин этого не делать.

Аналогично, практически нет причин описывать локальную переменную

не инициализируя ее, поскольку описание может появляться везде, где

может стоять оператор, - не описывайте переменную, пока она вам не

нужна. Не используйте malloc() - операция new (#3.2.6) делает ту же

работу лучше. Многие объединения не нуждаются в имени - используйте

безымянные объединения (#2.5.2).

* Глава 1 *

Турне по C++

Единственный способ изучать новый язык

программирования - писать на нем программы.

- Брайэн Керниган

Эта глава представляет собой краткий обзор основных черт языка

программирования C++. Сначала приводится программа на C++, затем

показано, как ее откомпилировать и запустить, и как такая программа

может выводить выходные данные и считывать входные. В первой трети

этой главы после введения описаны наиболее обычные черты C++:

основные типы, описания, выражения, операторы, функции и структура

программы. Оставшаяся часть главы посвящена возможностям C++ по

определению новых типов, скрытию данных, операциям, определяемым

пользователем, и иерархии определяемых пользователем типов.

1.1 Введение

Это турне проведет вас через ряд программ и частей программ на

C++. К концу у вас должно сложиться общее представление об основных

особенностях C++, и будет достаточно информации, чтобы писать

простые программы. Для точного и полного объяснения понятий,

затронутых даже в самом маленьком законченном примере,

потребовалось бы несколько страниц определений. Чтобы не превращать

эту главу в описание или в обсуждение общих понятий, примеры

снабжены только самыми короткими определениями используемых

терминов. Термины рассматриваются позже, когда будет больше

примеров, способствующих обсуждению.

1.1.1 Вывод

Прежде всего, давайте напишем программу, выводящую строку

выдачи:

#include

main()

{

cout << "Hello, world\n";

}

Строка #include сообщает компилятору, чтобы он включил

стандартные возможности потока ввода и вывода, находящиеся в файле

stream.h. Без этих описаний выражеине cout << "Hello, world\n" не

имело бы смысла. Операция << ("поместить в"*) пишет свой первый

аргумент во второй (в данном случае, строку "Hello, world\n" в

____________________

* Программирующим на C << известно как операция сдвига влево для

целых. Такое использование << не утеряно; просто в дальнейшем <<

было определено для случая, когда его левый операнд является

потоком вывода. Как это делается, описано в #1.8. (прим. автора)

- стр 20 -

стандартный поток вывода cout). Строка - это последовательность

символов, заключенная в двойные кавычки. В строке символ обратной

косой \, за которым следует другой символ, обозначает один

специальный символ; в данном случае, \n является символом новой

строки. Таким образом выводимые символы состоят из Hello, world и

перевода строки.

Остальная часть программы

main() { ... }

определяет функцию, названную main. Каждая программа должна

содержать функцию с именем main, и работа программы начинается с

выполнения этой функции.

1.1.2 Компиляция

Откуда появились выходной поток cout и код, реализующий операцию

вывода <<<< были описаны в stream.h, то есть, были

указаны их типы, но не было дано никаких подробностей относительно

их реализации. В стандартной библиотеке содержится спецификация

пространства и инициализирующий код для cout и <<< "inches";

cin >> inch;

cout << inch;

cout << " in = ";

cout << inch*2.54;

cout << " cm\n";

}

Первая строка функции main() описывает целую переменную inch. Ее

значение считывается с помощью операции >> ("взять из") над

стандартным потоком ввода cin. Описания cin и >>, конечно же,

находятся в . После ее запуска ваш терминал может

выглядеть примерно так:

$ a.out

inches=12

12 in = 30.48 cm

$

В этом примере на каждую команду вывода приходится один оператор;

это слишком длинно. Операцию вывода << можно применять к ее

собственному результату, так что последние четыре команды вывода

можно было записать одним оператором:

cout << inch << " in = " << inch*2.54 << " cm\n";

- стр 22 -

В последующих разделах ввод и вывод будут описаны гораздо более

подробно. Вся эта глава фактически может рассматриваться как

объяснение того, как можно написать предыдущие программы на языке,

который не обеспечивает операции ввода-вывода. На самом деле,

приведенные выше программы написаны на C++, "расширенном"

операциями ввода-вывода посредством использования библиотек и

включения файлов с помощью #include. Другими словами, язык C++ в

том виде, в котором он описан в справочном руководстве, не

определяет средств ввода-вывода; вместо этого исключительно с

помощью средств, доступных любому программисту, определены операции

<< и >>.

1.2 Комментарии

Часто бывает полезно вставлять в программу текст, который

предназначается в качестве комментария только для читающего

программу человека и игнорируется компилятором в программе. В C++

это можно сделать одним из двух способов.

Символы /* начинают комментарий, заканчивающийся символами */.

Вся эта последовательность символов эквивалентна символу пропуска

(например, символу пробела). Это наиболее полезно для многострочных

комментариев и изъятия частей программы при редактировании, однако

следует помнить, что комментарии /* */ не могут быть вложенными.

Символы // начинают комментарий, который заканчивается в конце

строки, на которой они появились. Опять, вся последовательность

символов эквивалентна пропуску. Этот способ наиболее полезен для

коротких комментариев. Символы // можно использовать для того,

чтобы закомментировать символы /* или */, а символами /* можно

закомментировать //.

1.3 Типы и Описания

Каждое имя и каждое выражение имеет тип, определяющий операции,

которые могут над ними производиться. Например, описание

int inch;

определяет, что inch имеет тип int, то есть, inch является целой

переменной.

Описание - это оператор, который вводит имя в программе. Описание

задает тип этого имени. Тип определяет правильное использование

имени или выражения. Для целых определены такие операции, как +, -,

* и /. После того, как включен файл stream.h, объект типа int может

также быть вторым операндом <<, когда первый операнд ostream.

Тип объекта определяет не только то, какие операции могут к нему

применяться, но и смысл этих операций. Например, оператор

cout << inch << " in = " << inch*2.54 << " cm\n";

правильно обрабатывает четыре входных значения различным образом.

Строки печатаются буквально, тогда как целое inch и значение с

плавающей точкой inch*2.54 преобразуются из их внутреннего

представлениия в подходящее для человеческого глаза символьное

представление.

- стр 23 -

В C++ есть несколько основных типов и несколько способов

создавать новые. Простейшие виды типов C++ описываются в следующих

разделах, а более интересные оставлены на потом.

1.3.1 Основные Типы

Основные типы, наиболее непосредственно отвечающие средствам

аппаратного обеспечения, такие:

char short int long float double

Первые четыре типа используются для представления целых, последние

два - для представления чисел с плавающей точкой. Переменная типа

char имеет размер, естественный для хранения символа на данной

машине (обычно, байт), а переменная типа int имеет размер,

соответствующий целой арифметике на данной машине (обычно, слово).

Диапазон целых чисел, которые могут быть представлены типом,

зависит от его размера. В C++ размеры измеряются в единицах размера

данных типа char, поэтому char по определению имеет размер единица.

Соотношение между основными типами можно записать так:

1 = sizeof(char) <= sizeof(short) <= sizeof(int) <= sizeof(long)

sizeof(float) <= sizeof(double)

В целом, предполагать что-либо еще относительно основных типов

неразумно. В частности, то, что целое достаточно для хранения

указателя, верно не для всех машин.

К основному типу можно применять прилагательное const. Это дает

тип, имеющий те же свойства, что и исходный тип, за исключением

того, что значение переменных типа const не может изменяться после

инициалиизации.

const float pi = 3.14;

const char plus = '+';

Символ, заключенный в одинарные кавычки, является символьной

константой. Заметьте, что часто константа, определенная таким

образом, не занимает память; просто там, где требуется, ее значение

может использоваться непосредственно. Константа должна

инициализироваться при описании. Для переменных инициализация

необязательна, но настоятельно рекомендуется. Оснований для

введения локальнной переменной без ее инициализации очень немного.

К любой комбинации этих типов могут применяться арифметические

операции:

+ (плюс, унарный и бинарный)

- (минус, унарный и бинарный)

* (умножение)

/ (деление)

А также операции сравнения:

- стр 24 -

== (равно)

!= (не равно)

< (меньше)

> (больше)

<= (меньше или равно)

>= (больше или равно)

Заметьте, что целое деление дает целый результат: 7/2 есть 3. Над

целыми может выполняться операция % получения остатка: 7%2 равно 1.

При присваивании и арифметических операциях C++ выполняет все

осмысленнные преобразования между основными типами, чтобы их можно

было сочетать без ограничений:

double d = 1;

int i = 1;

d = d + i;

i = d + i;

1.3.2 Производные Типы

Вот операции, создающие из основных типов новые типы:

* указатель на

*const константный указатель на

& ссылка на

[] вектор*

() функция, возвращающая

Например:

char* p // указатель на символ

char *const q // константный указатель на символ

char v[10] // вектор из 10 символов

Все вектора в качестве нижней границы индекса имеют ноль, поэтому в

v десять элементов:v[0] ... v[9]. Функции объясняются в #1.5,

ссылки в #1.9. Переменная указатель может содержать адрес объекта

соответствующего типа:

char c;

// ...

p = &c; // p указывает на c

Унарное & является операцией взятия адреса.

1.4 Выражения и Операторы

В C++ имеется богатый набор операций, с помощью которых в

выражениях образуются новые значения и изменяются значения

____________________

* одномерный массив. Это принятый термин (например, вектора

прерываний), и мы сочли, что стандартный перевод его как "массив"

затуманит изложение. (прим. перев.)

- стр 25 -

переменных. Поток управления в программе задается с помощью

операторов , а описания используются для введения в программе имен

переменных, констант и т.д. Заметьте, что описания являются

операторами, поэтому они свободно могут сочетаться с другими

операторами.

1.4.1 Выражения

В C++ имеется большое число операций, и они будут объясняться

там, где (и если) это потребуется. Следует учесть, что операции

~ (дополнение)

& (И)

^ (исключающее ИЛИ)

| (включающее ИЛИ)

<< (логический сдвиг влево)

>> (логический сдвиг вправо)

применяются к целым, и что нет отдельного типа данных для

логических действий.

Смысл операции зависит от числа операндов; унарное & является

операцией взятия адреса, а бинарное & - это операция логического И.

Смысл операции зависит также от типа ее операндов: + в выражении

a+b означает сложение с плавающей точкой, если операнды имеют тип

float, но целое сложение, если они типа int. В #1.8 объясняется,

как можно определить операцию для типа, определяемого

пользователем, без потери ее значения, предопределенного для

основных и производных типов.

В C++ есть операция присваивания =, а не оператор присваивания,

как в некоторых языках. Таким образом, присваивание может

встречаться в неожиданном контексте; например, x=sqrt(a=3*x). Это

бывает полезно. a=b=c означает присвоение c объекту b, а затем

объекту a. Другим свойством операции присваивания является то, что

она может совмещаться с большинством бинарных операций. Например,

x[i+3]*=4 означает x[i+3]=x[i+3]*4, за исключением того факта, что

выражение x[i+3] вычисляется только один раз. Это дает

привлекательную степень эффективности без необходимости обращения к

оптимизирующим компиляторам. К тому же это более кратко.

В большинстве программ на C++ широко применяются указатели.

Унарная операция * разыменовывает* указатель, т.е. *p есть объект,

на который указывает p. Эта операция также называется косвенной

адресацией. Например, если имеется char* p, то *p есть символ, на

который указывает p. Часто при работе с указателями бывают полезны

операция увеличения ++ и операция уменьшения --. Предположим, p

указывает на элемент вектора v, тогда p++ делает p указывающим на

следующий элемент.

1.4.2 Операторы Выражения

Самый обычный вид оператора - оператор выражение. Он состоит из

выражения, за которым следует точка с запятой. Например:

____________________

* англ. dereference - получить значение объекта, на который

указывает данный указатель. (прим. перев.)

- стр 26 -

a = b*3+c;

cout << "go go go";

lseek(fd,0,2);

1.4.3 Пустой оператор

Простейшей формой оператора является пустой оператор:

;

Он не делает ничего. Однако он может быть полезен в тех случаях,

когда синтаксис требует наличие оператора, а вам оператор не нужен.

1.4.4 Блоки

Блок - это возможно пустой список операторов, заключенный в

фигурные скобки:

{ a=b+2; b++; }

Блок позволяет рассматривать несколько операторов как один. Область

видимости имени, описанного в блоке, простирается до конца блока.

Имя можно сделать невидимым с помощью описаний такого же имени во

внутренних блоках.

1.4.5 Операторы if

Программа в следующем примере осуществляет преобразование дюймов

в сантиметры и сантиметров в дюймы; предполагается, что вы укажете

единицы измерения вводимых данных, добавляя i для дюймов и c для

сантиметров:

- стр 27 -

#include

main()

{

const float fac = 2.54;

float x, in, cm;

char ch = 0;

cout << "введите длину: ";

cin >> x >> ch;

if (ch == 'i') { // inch - дюймы

in = x;

cm = x*fac;

}

else if (ch == 'c') // cm - сантиметры

in = x/fac;

cm = x;

}

else

in = cm = 0;

cout << in << " in = " << cm << " cm\n";

}

Заметьте, что условие в операторе if должно быть заключено в

круглые скобки.

1.4.6 Операторы switch

Оператор switch производит сопоставление значения с множеством

констант. Проверки в предыдущем примере можно записать так:

switch (ch) {

case 'i':

in = x;

cm = x*fac;

break;

case 'c':

in = x/fac;

cm = x;

break;

default:

in = cm = 0;

break;

}

Операторы break применяются для выхода из оператора switch.

Константы в вариантах case должны быть различными, и если

проверяемое значение не совпадает ни с одной из констант,

выбирается вариант default. Программисту не обязательно

предусматривать default.

- стр 28 -

1.4.7 Оператор whilе

Рассмотрим копирование строки, когда заданы указатель p на ее

первый символ и указатель q на целевую строку. По соглашению строка

оканчивается символом с целым значением 0.

while (p != 0) {

*q = *p; // скопировать символ

q = q+1;

p = p+1;

}

*q = 0; // завершающий символ 0 скопирован не был

Следующее после while условие должно быть заключено в круглые

скобки. Условие вычисляется, и если его значение не ноль,

выполняется непосредственно следующий за ним оператор. Это

повторяется до тех пор, пока вычисление условия не даст ноль.

Этот пример слишком пространен. Можно использовать операцию ++

для непосредственного указания увеличения, и проверка упростится:

while (*p) *q++ = *p++;

*q = 0;

где конструкция *p++ означает: "взять символ, на который указывает

p, затем увеличить p."

Пример можно еще упростить, так как указатель p разыменовывается

дважды за каждый цикл. Копирование символа можно делать тогда же,

когда производится проверка условия:

while (*q++ = *p++) ;

Здесь берется символ, на который указывает p, p увеличивается, этот

символ копируется туда, куда указывает q, и q увеличивается. Если

символ ненулевой, цикл повторяется. Поскольку вся работа

выполняется в условии, не требуется ниодного оператора. Чтобы

указать на это, используется пустой оператор. C++ (как и C)

одновременно любят и ненавидят за возможность такого чрезвычайно

краткого ориентированного на выразительность программирования*.

1.4.8 Оператор for

Рассмотрим копирование десяти элементов одного вектора в другой:

for (int i=0; i<10; i++) q[i]=p[i];

Это эквивалентно

int i = 0;

while (i<10) {

q[i] = p[i];

i++;

}

____________________

* в оригинале expression-oriented (expression - выразительность и

выражение). (прим. перев.)

- стр 29 -

но более удобочитаемо, поскольку вся информация, управляющая

циклом, локализована. При применении операции ++ к целой

переменной к ней просто добавляется единица. Первая часть оператора

for не обязательно должна быть описанием, она может быть любым

оператором. Например:

for (i=0; i<10; i++) q[i]=p[i];

тоже эквивалентно предыдущей записи при условии, что i

соответствующим образом описано раньше.

1.4.9 Описания

Описание - это оператор, вводящий имя в программе. Оно может

также инициализировать объект с этим именем. Выполнение описания

означает, что когда поток управления доходит до описания,

вычисляется инициализирующее выражение (инициализатор) и

производится инициализация. Например:

for (int i = 1; i

1.5 Функции

Функция - это именованная часть программы, к которой можно

обращаться из других частей программы столько раз, сколько

потребуется. Рассмотрим программу, печатающую степени числа 2:

extern float pow(float, int); //pow() определена в другом месте

main()

{

for (int i=0; i<10; i++) cout << pow(2,i) << "\n";

}

Первая строка функции - описание, указывающее, что pow - функция,

получающая параметры типа float и int и возвращающая float.

Описание функции используется для того, чтобы сделать определенными

обращения к функции в других местах.

При вызове тип каждого параметра функции сопоставляется с

ожидаемым типом точно так же, как если бы инициализировалась

переменная описанного типа. Это гарантирует надлежащую проверку и

преобразование типов. Напрмер, обращение pow(12.3,"abcd") вызовет

недовольство компилятора, поскольку "abcd" является строкой, а не

int. При вызове pow(2,i) компилятор преобразует 2 к типу float, как

того требует функция. Функция pow может быть определена например

так:

- стр 30 -

float pow(float x, int n)

{

if (n < 0) error("извините, отрицателный показатель для pow()");

switch (n) {

case 0: return 1;

case 1: return x;

default: return x*pow(x,n-1);

}

}

Первая часть определения функции задает имя функции, тип

возвращаемого ею значения (если таковое имеется) и типы и имена ее

параметров (если они есть). Значение возвращается из функции с

помощью оператора return.

Разные функции обычно имеют разные имена, но функциям,

выполняющим сходные действия над объектами различных типов, иногда

лучше дать возможность иметь одинаковые имена. Если типы их

параметров различны, то компилятор всегда может различить их и

выбрать для вызова нужную функцию. Может, например, иметься одна

функция возведения в степень для целых переменных и другая для

переменных с плавающей точкой:

overload pow;

int pow(int, int);

double pow(double, double);

//...

x=pow(2,10);

y=pow(2.0,10.0);

Описание

overload pow;

сообщает компилятору, что использование имени pow более чем для

одной функции является умышленным.

Если функция не возвращает значения, то ее следует описать как

void:

void swap(int* p, int* q) // поменять местами

{

int t = *p;

*p = *q;

*q = t;

}

1.6 Структура программы

Программа на C++ обычно состоит из большого числа исходных

файлов, каждый из которых содержит описания типов, функций,

переменных и констант. Чтобы имя можно было использовать в разных

исходных файлах для ссылки на один и тот же объект, оно должно

быть описано как внешнее. Например:

- стр 31 -

extern double sqrt(double);

extern instream cin;

Самый обычный способ обеспечить согласованность исходных файлов -

это поместить такие описания в отдельные файлы, называемые

заголовочными (или хэдер) файлами, а затем включить, то есть

скопировать, эти заголовочные файлы во все файлы, где нужны эти

описания. Например, если описание sqrt хранится в заголовочном

файле для стандартных математических функций math.h, и вы хотите

извлечь квадратный корень из 4, можно написать:

#include

//...

x = sqrt(4);

Поскольку обычные заголовочные файлы включаются во многие исходные

файлы, они не содержат описаний, которые не должны повторяться.

Например, тела функций даются только для inline-подставляемых

функций (#1.12) и инициализаторы даются только для констант

(#1.3.1). За исключением этих случаев, заголовочный файл является

хранилищем информации о типах. Он обеспечивает интерфейс между

отдельно компилируемыми частями программы.

В команде включения include имя файла, заключенное в угловые

скобки, например , относится к файлу с этим именем в

стандартном каталоге (часто это /usr/include/CC); на файлы,

находящиеся в каких-либо других местах ссылаются с помощью имен,

заключенных в двойные кавычки. Например:

#include "math1.h"

#include "/usr/bs/math2.h"

включит math1.h из текущего пользовательского каталога, а math2.h

из каталога /usr/bs.

Здесь приводится очень маленький законченный пример программы, в

котором строка определяется в одном файле, а ее печать производится

в другом. Файл header.h определяет необходимые типы:

// header.h

extern char* prog_name;

extern void f();

В файле main.c находится главная программа:

// main.c

#include "header.h"

char* prog_name = "дурацкий, но полный";

main()

{

f();

}

а файл f.c печатает строку:

- стр 32 -

// f.c

#include

#include "header.h"

void f()

{

cout << prog_name << "\n";

}

Скомпилировать и запустить программу вы можете например так:

$ CC main.c f.c -o silly

$ silly

дурацкий, но полный

$

1.7 Классы

Давайте посмотрим, как мы могли бы определить тип потока вывода

ostream. Чтобы упростить задачу, предположим, что для буферизации

определен тип streambuf. Тип streambuf на самом деле определен в

, где также находится и настоящее определение ostream.

Пожалуйста, не испытывайте примеры, определяющие ostream в этом и

последующих разделах; пока вы не сможете полностью избежать

использования , компилятор будет возражать против

переопределений.

Определение типа, определяемого пользователем (который в C++

называется class, т.е. класс), специфицирует данные, необходимые

для представления объекта этого типа, и множество операций для

работы с этими объектами. Определение имеет две части: закрытую

(private) часть, содержащую информацию, которой может пользоваться

только его разработчик, и открытую (public) часть, представляющую

интерфейс типа с пользователем:

class ostream {

streambuf* buf;

int state;

public:

void put(char*);

void put(long);

void put(double);

}

Описания после метки public задают интерфейс: пользователь может

обращаться только к трем функциям put(). Описания перед меткой

public задают представление объекта класса ostream; имена buf и

state могут использоваться только функциями put(), описанными в

открытой части.

class определяет тип, а не объект данных, поэтому чтобы

использовать ostream, мы должны один такой объект описать (так же,

как мы описываем переменные типа int):

ostream my_out;

- стр 33 -

Считая, что my_out был соответствующим образом проинициализирован

(как, объясняется в #1.10), его можно использовать например так:

my_out.put("Hello, world\n");

С помощью операции точка выбирается член класса для данного

объекта этого класса. Здесь для объекта my_out вызывается член

функция put().

Функция может определяться так:

void ostream::put(char* p)

{

while (*p) buf.sputc(*p++);

}

где sputc() - функция, которая помещает символ в streambuf.

Префикс ostream необходим, чтобы отличить put() ostream'а от других

функций с именем put().

Для обращения к функции члену должен быть указан объект класса. В

функции члене можно ссылаться на этот объект неявно, как это

делалось выше в ostream::put(): в каждом вызове buf относится к

члену buf объекта, для которого функция вызвана.

Можно также ссылаться на этот объект явно посредством указателя с

именем this. В функции члене класса X this неявно описан как X*

(указатель на X) и инициализирован указателем на тот объект, для

которого эта функция вызвана. Определение ostream::put() можно

также записать в виде:

void ostream::put(char* p)

{

while (*p) this->buf.sputc(*p++);

}

Операция -> применяется для выбора члена объекта, заданного

указателем.

1.8 Перегрузка операций

Настоящий класс ostream определяет операцию <<, чтобы сделать

удобным вывод нескольких объектов одним оператором. Давайте

посмотрим, как это сделано.

Чтобы определить @, где @ - некоторая операция языка C++, для

каждого определяемого пользователем типа вы определяете функцию с

именем operator@, которая получает параметры соответствующего типа.

Например:

- стр 34 -

class ostream {

//...

ostream operator<<(char*);

};

ostream ostream::operator<<(char* p)

{

while (*p) buf.sputc(*p++);

return *this;

}

определяет операцию << как член класса ostream, поэтому s<

");

а если применить операцию взятия адреса, то вы получите адрес

объекта, на который ссылается ссылка:

&s1 == &my_out

Первая очевидная польза от ссылок состоит в том, чтобы обеспечить

передачу адреса объекта, а не самого объекта, в фукнкцию вывода (в

некоторых языках это называется передачей параметра по ссылке):

ostream& operator<<(ostream& s, complex z) {

return s << "(" << z.real << "," << z.imag << ")";

}

Достаточно интересно, что тело функции осталось без изменений, но

если вы будете осуществлять присваивание s, то будете

воздействовать на сам объект, а не на его копию. В данном случае

то, что возвращается ссылка, также повышает эффективность,

поскольку очевидный способ реализации ссылки - это указатель, а

передача указателя гораздо дешевле, чем передача большой структуры

данных.

Ссылки также существенны для определения потока ввода, поскольку

операция ввода получает в качестве операнда переменную для

считывания. Если бы ссылки не использовались, то пользователь

должен был бы явно передавать указатели в функции ввода.

class istream {

//...

int state;

public:

istream& operator>>(char&);

istream& operator>>(char*);

istream& operator>>(int&);

istream& operator>>(long&);

//...

};

Заметьте, что для чтения long и int используются разные функции,

тогда как для их печати требовалась только одна. Это вполне обычно,

и причина в том, что int может быть преобразовано в long по

стандартным правилам неявного преобразования (#с.6.6), избавляя

таким образом программиста от беспокойства по поводу написания

обеих функций ввода.

- стр 36 -

1.10 Конструкторы

Определение ostream как класса сделало члены данные закрытыми.

Только функция член имеет доступ к закрытым членам, поэтому надо

предусмотреть функцию для инициализации. Такая функция называется

конструктором и отличается тем, что имеет то же имя, что и ее

класс:

class ostream {

//...

ostream(streambuf*);

ostream(int size, char* s);

};

Здесь задано два конструктора. Один получает вышеупомянутый

streambuf для реального вывода, другой получает размер и указатель

на символ для форматирования строки. В описании необходимый для

конструктора список параметров присоединяется к имени. Теперь вы

можете, например, описать такие потоки:

ostream my_out(&some_stream_buffer);

char xx[256];

ostream xx_stream(256,xx);

Описание my_out не только задает соответствующий объем памяти

где-то в другом месте, оно также вызывает конструктор

ostream::ostream(streambuf*), чтобы инициализировать его параметром

&some_stream_buffer, предположительно указателем на подходящий

объект класса streambuf. Описание конструкторов для класса не

только дает способ инициализации объектов, но также обеспечивает

то, что все объекты этого класса будут проинициализированы. Если

для класса были описаны конструкторы, то невозможно описать

переменную этого класса так, чтобы конструктор не был вызван. Если

класс имеет конструктор, не получающий параметров, то этот

конструктор будет вызываться в том случае, если в описании нет ни

одного параметра.

1.11 Вектора

Встоенное в C++ понятие вектора было разработано так, чтобы

обеспечить максимальную эффективность выполнения при минимальном

расходе памяти. Оно также (особенно когда используется совместно с

указателями) является весьма универсальным инструментом для

построения средств более высокого уровня. Вы могли бы, конечно,

возразить, что размер вектора должен задаваться как константа, что

нет проверки выхода за границы вектора и т.д. Ответ на подобные

возражения таков: "Вы можете запрограммировать это сами." Давайте

посмотрим, действительно ли оправдан такой ответ. Другими словами,

проверим средства абстракции языка C++, попытавшись реализовать эти

возможности для векторных типов, которые мы создадим сами, и

посмотрим, какие с этим связаны трудности, каких это требует

затрат, и насколько получившиеся векторные типы удобны в обращении.

- стр 37 -

class vector {

int* v;

int sz;

public:

vector(int); // конструктор

~vector(); // деструктор

int size() { return sz; }

void set_size(int);

int& operator[](int);

int& elem(int i) { return v[i]; }

};

Функция size возвращает число элементов вектора, таким образом

индексы должны лежать в диапазоне 0 ... size()-1. Функция set_size

сделана для изменения этого размера, elem обеспечивает доступ к

элементам без проверки индекса, а operator[] дает доступ с

проверкой границ.

Идея состоит в том, чтобы класс сам был структурой фиксированного

размера, управляющей доступом к фактической памяти вектора, которая

выделяется конструктором вектора с помощью распределителя свободной

памяти new:

vector::vector(int s)

{

if (s<=0) error("плохой размер вектора");

sz = s;

v = new int[s];

}

Тепрь вы можете описывать вектора типа vector почти столь же

элегантно, как и вектора, встроенные в сам язык:

vector v1(100);

vector v2(nelem*2-4);

Операцию доступа можно определить как

int& vector::operator[](int i)

{

if(i<0 || sz<=i) error("индекс выходит за границы");

return v[i];

}

Операция || (ИЛИИЛИ) - это логическая операция ИЛИ. Ее правый

операнд вычисляется только тогда, когда это необходимо, то есть

если вычисление левого операнда дало ноль. Возвращение ссылки

обеспечивает то, что запись [] может использоваться с любой стороны

операции присваивания:

v1[x] = v2[y];

Функция со странным именем ~vector - это деструктор, то есть

функция, описанная для того, чтобы она неявно вызывалась, когда

объект класса выходит из области видимости. Деструктор класса C

имеет имя ~C. Если его определить как

- стр 38 -

vector::~vector()

{

delete v;

}

то он будет, с помощью операции delete, освобождать пространство,

выделенное конструктором, поэтому когда vector выходит из области

видимости, все его пространство возвращается обратно в память для

дальнейшего использования.

1.12 Inline-подстановка

Если часто повторяется обращение к очень маленькой функции, то вы

можете начать беспокоиться о стоимости вызова функции. Обращение к

функции члену не дороже обращения к функции не члену с тем же

числом параметров (надо помнить, что функция член всегда имеет хотя

бы один параметр), и вызовы в функций в C++ примерно столь же

эффективны, сколь и в любом языке. Однако для слишком маленьких

функций может встать вопрос о накладных расходах на обращение. В

этом случае можно рассмотреть возможность спецификации функции как

inline-подставляемой. Если вы поступите таким образом, то

компилятор сгенерирует для функции соответствующий код в месте ее

вызова. Семантика вызова не изменяется. Если, например, size и elem

inline-подставляемые, то

vector s(100);

//...

i = s.size();

x = elem(i-1);

порождает код, эквивалентный

//...

i = 100;

x = s.v[i-1];

C++ компилятор обычно достаточно разумен, чтобы генерировать

настолько хороший код, насколько вы можете получить в результате

прямого макрорасширения. Разумеется, компилятор иногда вынужден

использовать временные переменные и другие уловки, чтобы сохранить

семантику.

Вы можете указать, что вы хотите, чтобы функция была inline-

подставляемой, поставив ключевое слово inline, или, для функции

члена, просто включив определение функции в описание класса, как

это сделано в предыдущем примере для size() и elem().

При хорошем использовании inline-функции резко повышают скорость

выполнения и уменьшают размер объектного кода. Однако, inline-

функции запутывают описания и могут замедлить компиляцию, поэтому,

если они не необходимы, то их желательно избегать. Чтобы inline-

функция давала существенный выигрыш по сравнению с обычной

функцией, она должна быть очень маленькой.

- стр 39 -

1.13 Производные классы

Теперь давайте определим вектор, для которого пользователь может

задавать границы изменения индекса.

class vec: public vector {

int low, high;

public:

vec(int,int);

int& elem(int);

int& operator[](int);

};

Определение vec как

:public vector

означает, в первую очередь, что vec это vector. То есть, тип vec

имеет (наследует) все свойства типа vector дополнительно к тем, что

описаны специально для него. Говорят, что класс vector является

базовым классом для vec, а о vec говорится, что он производный от

vector.

Класс vec модифицирует класс vector тем, что в нем задается

другой конструктор, который требует от пользователя указывать две

границы изменения индекса, а не длину, и имеются свои собственные

функции доступа elem(int) и operator[](int). Функция elem() класса

vec легко выражается через elem() класса vector:

int& vec::elem(int i)

{

return vector::elem(i-low);

}

Операция разрешения области видимости :: используется для того,

чтобы не было бесконечной рекурсии обращения к vec::elem() из нее

самой. с помощью унарной операции :: можно ссылаться на нелокальные

имена. Было бы разумно описать vec::elem() как inline, поскольку,

скорее всего, эффективность существенна, но необязательно,

неразумно и невозможно написать ее так, чтобы она непосредственно

использовала закрытый член v класса vector. Фунции производного

класса не имеют специального доступа к закрытым членам его базового

класса.

Конструктор можно написать так:

vec::vec(int lb, int hb) : (hb-lb+1)

{

if (hb-lb<0) hb = lb;

low = lb;

high = hb;

}

Запись : (hb-lb+1) используется для определения списка параметров

конструктора базового класса vector::vector(). Этот конструктор

вызывается перед телом vec::vec(). Вот небольшой пример, который

можно запустить, если скомпилировать его вместе с остальными

описаниями vector:

- стр 40 -

#include

void error(char* p)

{

cerr << p << "n\"; // cerr - выходной поток сообщений об

ошибках

exit(1);

}

void vector::set_size(int) { /* пустышка */ }

int& vec::operator[](int i)

{

if (i

1.14 Еще об операциях

Другое направление развития - снабдить вектора операциями:

- стр 41 -

class Vec : public vector {

public:

Vec(int s) : (s) {}

Vec(Vec&);

~Vec() {}

void operator=(Vec&);

void operator*=(Vec&);

void operator*=(int);

//...

};

Обратите внимание на способ определения конструктора производного

класса, Vec::Vec(), когда он передает свой параметр конструктору

базового класса vector::vector() и больше не делает ничего. Это

полезная парадигма. Операция присваивания перегружена, ее можно

определить так:

void Vec::operator=(Vec& a)

{

int s = size();

if (s!=a.size()) error("плохой размер вектора для =");

for (int i = 0; i

void error(char* p) {

cerr << p << "\n";

exit(1);

}

void vector::set_size(int) { /*...*/ }

int& vec::operator[](int i) { /*...*/ }

main()

{

Vec a(10);

Vec b(10);

for (int i=0; i

1.15 Друзья (friend)

Функция operator+() не воздействует непосредственно на

представление вектора. Действтельно, она не может этого делать,

поскольку не является членом. Однако иногда желательно дать

функциям не членам возможность доступа к закрытой части класса.

Например, если бы не было функции "доступа без проверки"

vector::elem(), вам пришлось бы проверять индекс i на соответствие

границам три раза за каждый проход цикла. Здесь мы избежали этой

сложности, но она довольно типична, поэтому у класса есть механизм

предоставления права доступа к своей закрытой части функциям не

членам. Просто в описание класса помещается описание функции, перед

которым стоит ключевое слово friend. Например, если имеется

class Vec; // Vec - имя класса

class vector {

friend Vec operator+(Vec, Vec);

//...

};

- стр 43 -

То вы можете написать

Vec operator+(Vec a, Vec b)

{

int s = a.size();

if (s != b.size()) error("плохой размер вектора для +");

Vec& sum = *new Vec(s);

int* sp = sum.v;

int* ap = a.v;

int* bp = b.v;

while (s--) *sp++ = *ap++ + *bp++;

return sum;

}

Одним из особенно полезных аспектов механизма friend является то,

что функция может быть другом двух и более классов. Чтобы увидеть

это, рассмотрим определение vector и matrix, а затем определение

функции умножения (см. #с.8.8).

1.16 Обобщенные Вектора

"Пока все хорошо," - можете сказать вы, - "но я хочу, чтобы один

из этих векторов был типа matrix, который я только что определил."

К сожалению, в C++ не предусмотрены средства для определения класса

векторов с типом элемента в качестве параметра. Один из способов -

продублировать описание и класса, и его функций членов. Это не

идеальный способ, но зачастую вполне приемлемый.

Вы можете воспользоваться препроцессором (#4.7), чтобы

механизировать работу. Например, класс vector - упрощенный вариант

класса, который можно найти в стандартном заголовочном файле. Вы

могли бы написать:

#include

declare(vector,int);

main()

{

vector(int) vv(10);

vv[2] = 3;

vv[10] = 4; // ошибка: выход за границы

}

Файл vector.h таким образом определяет макросы, чтобы

declare(vector,int) после расширения преврашался в описание класса

vector, очень похожий на тот, который был определен выше, а

implement(vector,int) расширялся в определение функций этого

класса. Поскольку implement(vector,int) в результате расширения

превращается в определение функций, его можно использовать в

программе только один раз, в то время как declare(vector,int)

должно использоваться по одному разу в каждом файле, работающем с

этим типом целых векторов.

- стр 44 -

declare(vector,char);

//...

implement(vector,char);

даст вам отдельный тип "вектор символов". Пример реализации

обобщенных классов с помощью макросов приведен в #7.3.5.

1.17 Полиморфные Вектора

У вас есть другая возможность - определить ваш векторный и другие

вмещающие классы через указатели на объекты некоторого класса:

class common {

//...

};

class vector {

common** v;

//...

public:

cvector(int);

common*& elem(int);

common*& operator[](int);

//...

};

Заметьте, что поскольку в таких векторах хранятся указатели, а не

сами объекты, объект может быть "в" нескольких таких векторах

одновременно. Это очень полезное свойство подобных вмещающих

классов, таких, как вектора, связанные списки, множества и т.д.

Кроме того, можно присваивать указатель на производный класс

указателю на его базовый класс, поэтому можно использовать

приведенный выше cvector для хранения указателей на объекты всех

производных от common классов. Например:

class apple : public common { /*...*/ }

class orange : public common { /*...*/ }

class apple_vector : public cvector {

public:

cvector fruitbowl(100);

//...

apple aa;

orange oo;

//...

fruitbowl[0] = &aa;

fruitbowl[1] = &oo;

}

Однако, точный тип объекта, вошедшего в такой вмещающий класс,

больше компилятору не известен. Например, в предыдущем примере вы

знаете, что элемент вектора является common, но является он apple

или orange? Обычно точный тип должен впоследствие быть

восстановлен, чтобы обеспечить правильное использование объекта.

Для этого нужно или в какой-то форме хранить информацию о типе в

самом объекте, или обеспечить, чтобы во вмещающий класс помещались

- стр 45 -

только объекты данного типа. Последнее легко достигается с помощью

производного класса. Вы можете, например, создать вектор

указателей на apple:

class apple_vector : public cvector {

public:

apple*& elem(int i)

{ return (apple*&) cvector::elem(i); }

//...

};

используя запись приведения к типу (тип)выражение, чтобы

преобразовать common*& (ссылку на указатель на common), которую

возвращает cvector::elem, в apple*&. Такое применение производных

классов создает альтернативу обобщенным классам. Писать его немного

труднее (если не использовать макросы таким образом, чтобы

производные классы фактически реализовывали обобщенные классы; см.

#7.3.5), но оно имеет то преимущество, что все производные классы

совместно используют единственную копию функции базового класса. В

случае обобщенных классов, таких, как vector(type), для каждого

нового используемого типа должна создаваться (с помощью

implement()) новая копия таких функций. Другой способ, хранение

идентификации типа в каждом объекте, приводит нас к стилю

программирования, который часто называют объекто-основанным или

объектно-ориентированным.

1.18 Виртуальные функции

Предположим, что мы пишем программу для изображения фигур на

экране. Общие атрибуты фигуры представлены классом shape, а

специальные атрибуты - специальными классами:

class shape {

point center;

color col;

//...

public:

void move(point to) { center=to; draw(); }

point where() { return center; }

virual void draw();

virtual void rotate(int);

//...

};

Функции, которые можно определить не зная точно определенной фигуры

(например, move и where, то есть, "передвинуть" и "где"), можно

описать как обычно. Остальные функции описываются как virual, то

есть такие, которые должны определяться в производном классе.

Например:

- стр 46 -

class circle: public shape {

int radius;

public:

void draw();

void rotatte(int i) {}

//...

};

Теперь, если shape_vec - вектор фигур, то можно написать:

for (int i = 0; i

* Глава 2 *

Описания и Константы

Совершенство достигается только к моменту краха.

- С.Н. Паркинсон

В этой главе описаны основные типы (char, int, float и т.д.) и

основные способы построения из них новых типов (функций, векторов,

указателей и т.д.). Имя вводится в программе посредством описаниия,

которое задает его тип и, возможно, начальное значение. Даны

понятия описания, определения, области видимости имен, времени

жизни объектов и типов. Описываются способы записи констант в C++,

а также способы определения символических констант. Примеры просто

демонстрируют характерные черты языка. Более развернутый и

реалистичный пример приводится в следующей главе для знакомства с

выраженями и операторами языка C++. Механизмы задания типов,

определяемых пользователем, с присоединенными операциями

представлены в Главах 4, 5 и 6 и здесь не упоминаются.

2.1 Описания

Прежде чем имя (идентификатор) может быть использовано в C++

программе, он должно быть описано. Это значит, что надо задать его

тип, чтобы сообщить компилятору, к какого вида объектам относится

имя. Вот несколько примеров, иллюстрирующих разнообразие описаний:

char ch;

int count = 1;

char* name = "Bjarne";

struct complex { float re, im; };

complex cvar;

extern complex sqrt(complex);

extern int error_number;

typedef complex point;

float real(complex* p) { return p->re; };

const double pi = 3.1415926535897932385;

struct user;

Как можно видеть из этих примеров, описание может делать больше

чем просто ассоциировать тип с именем. Большинство описаний

являются также определениями; то есть они также определяют для

имени сущность, к которой оно относится. Для ch, count и cvar этой

сущностью является соответствующий объем памяти, который должен

использоваться как переменная - эта память будет выделена. Для real

это заданная функция. Для constant pi это значение

3.1415926535897932385. Для complex этой сущностью является новый

тип. Для point это тип complex, поэтому point становится синонимом

complex. Только описания

extern complex sqrt(complex);

extern int error_number;

struct user;

- стр 48 -

не являются одновременно определениями. Это означает, что объект, к

которому они относятся, должен быть определен где-то еще. Код

(тело) функции sqrt должен задаваться неким другим описанием,

память для переменной error_number типа int должна выделяться неким

другим описанием, и какое-то другое описание типа user должно

определять, что он из себя представляет. В C++ программе всегда

должно быть только одно определение каждого имени, но описаний

может быть много, и все описания должны согласовываться с типом

объекта, к которому они относятся, поэтому в этом фрагменте есть

две ошибки:

int count;

int count; // ошибка: переопределение

exnern int error_number;

exnern int error_number; // ошибка: несоответствие типов

а в этом - ниодной (об использовании extern см. #4.2):

exnern int error_number;

exnern int error_number;

Некотрые описания задают "значение" для сущностей, которые они

определяют:

struct complex { float re, im; };

typedef complex point;

float real(complex* p) { return p->re };

const double pi = 3.1415926535897932385;

Для типов, функций и костант "значение" неизменно; для

неконстантных типов данных начальное значение может впоследствие

изменяться:

int count = 1;

char* name = "Bjarne";

//...

count = 2;

name = "Marian";

Из всех определений только

char ch;

не задает значение. Всякое описание, задающее значение, является

определением.

2.1.1 Область Видимости

Описание вводит имя в области видимости; то есть, имя может

использоваться только в определенной части программы. Для имени,

описанного в функции (такое имя часто называют локальным), эта

область видимости простирается от точки описания до конца блока, в

котором появилось описание; для имени не в функции и не в классе

(называемого часто глобальным именем) область видимости

простирается от точки описания до конца файла, в котором появилось

описание. Описание имени в блоке может скрывать (прятать) описание

во внутреннем блоке или глобальное имя. Это значит, что можно

- стр 49 -

переопределять имя внутри блока для ссылки на другой объект. После

выхода из блока имя вновь обретает свое прежнее значение. Например:

int x; // глобальное x

f() {

int x; // локальное x прячет глобальное x

x = 1; // присвоить локальному x

{

int x; // прячет первое локальное x

x = 2; // присвоить второму локальному x

}

x = 3; // присвоить первому локальному x

}

int* p = &x; // взять адрес глобального x

Скрытие имен неизбежно при написании больших программ. Однако

читающий человек легко может не заметить, что имя скрыто, и

некоторые ошибки, возникающие вследствие этого, очень трудно

обнаружить, главным образом потому, что они редкие. Значит скрытие

имен следует минимизировать. Использование для глобальных

переменных имен вроде i или x напрашивается на неприятности.

С помощью применения операции разрешения области видимости ::

можно использовать скрытое глобальное имя. Например:

int x;

f()

{

int x = 1; // скрывает глобальное x

::x = 2; // присваивает глобальному x

}

Но возможности использовать скрытое локальное имя нет.

Область видимости имени начинается в точке описания. Это

означает, что имя можно использовать даже для задания его

собственного значения. Например:

int x;

f()

{

int x = x; // извращение

}

Это не является недопустимым, хотя и бессмысленно, и компилятор

предупредит, что x "used before set" ("использовано до того, как

задано"), если вы попробуете так сделать. Можно, напротив, не

применяя операцию ::, использовать одно имя для ссылки на два

различных объекта в блоке. Например:

- стр 50 -

int x;

f() // извращение

{

int y = x; // глобальное x

int x = 22;

y = x; // локальное x

}

Переменная y инициализируется значением глобального x, 11, а

затем ему присваивается значение локальной переменной x, 22.

Имена параметров функции считаются описанными в самом внешнем

блоке функции, поэтому

f(int x)

{

int x; // ошибка

}

содержит ошибку, так как x определено дважды в одной и той же

области видимости.

2.1.2 Объекты и Адреса (Lvalue)

Можно назначать и использовать переменные, не имеющие имен, и

можно осуществлять присваивание выражениям странного вида

(например, *p[a+10]=7). Следовательно, есть потребность в имени

"нечто в памяти". Вот соответствующая цитата из справочного

руководства по C++:"Объект есть область памяти; lvalue есть

выражение, ссылающееся на объект"(#с.5). Слово "lvalue"

первоначально было придумано для значения "нечто, что может стоять

в левой части присваивания". Однако не всякий адрес можно

использовать в левой части присваивания; бывают адреса, ссылающиеся

на константу (см. #2.4).

2.1.3 Время Жизни

Если программист не указал иного, то объект создается, когда

встречается его описание, и уничтожается, когда его имя выходит из

области видимости, Объекты с глобальными именами создаются и

инициализируются один раз (только) и "живут" до завершения

программы. Объекты, определенные описанием с ключевым словом

static, ведут себя так же. Например*:

____________________

* Команда #include была выброшена из примеров в этой

главе для экономии места. Она необходима в примерах, производящих

ввывод, чтобы они были полными. (прим. автора)

- стр 51 -

int a = 1;

void f()

{

int b = 1; // инициализируется при каждом вызове f()

static int c = 1; // инициализируется только один раз

cout << " a = " << a++

<< " b = " << b++

<< " c = " << c++ << "\n";

}

main()

{

while (a < 4) f();

}

производит вывод

a = 1 b = 1 c = 1

a = 2 b = 1 c = 2

a = 3 b = 1 c = 3

Не инициализированная явно статическая (static) переменная неявно

инициализируется нулем.

С помощью операций new и delete программист может также создавать

объекты, время жизни которых управляется непосредственно; см.

#3.2.4.

2.2 Имена

Имя (идентификатор) состоит из последовательности букв и цифр.

Первый символ должен быть буквой. Символ подчерка _ считается

буквой. C++ не налагает ограничений на число символов в имени, но

некоторые части реализации находятся вне ведения автора компилятора

(в частности, загрузчик), и они, к сожалению, такие ограничения

налагают. Некоторые среды выполнения также делают необходимым

расширить или ограничить набор символов, допустимых в

идентификаторе; расширения (например, при допущении в именах

символа $) порождают непереносимые программы. В качестве имени не

могут использоваться ключевые слова C++ (см. #с.2.3). Примеры имен:

hello this_is_a_most_unusially_long_name

DEFINED foO bAr u_name HorseSense

var0 var1 CLASS _class ___

Примеры последовательностей символов, которые не могут

использоваться как идентификаторы:

012 a fool $sys class 3var

pay.due foo~bar .name if

Буквы в верхнем и нижнем регистрах считаются различными, поэтому

Count и count - различные имена, но вводить имена, лишь

незначительно отличающиеся друг от друга, нежелательно. Имена,

начинающиеся с подчерка, по традиции используются для специальных

- стр 52 -

средств среды выполнения, поэтому использовать такие имена в

прикладных программах нежелательно.

Во время чтения программы компилятор всегда ищет наиболее длинную

строку, составляющую имя, поэтому var10 - это одно имя, а не имя

var, за которым следует число 10; и elseif - одно имя, а не

ключевое слово else, после которого стоит ключевое слово if.

2.3 Типы

Каждое имя (идентификатор) в C++ программе имеет ассоциированный

с ним тип. Этот тип определяет, какие операции можно применять к

имени (то есть к объекту, на который оно ссылается), и как эти

операции интерпретируются. Например:

int error number;

float real(complex* p);

Поскольку error_number описано как int, его можно присваивать,

использовать в арифметических выражениях и т.д. Тогда как функция

real может вызываться с адресом complex в качестве параметра. Можно

взять адрес любого из них. Некоторые имена, вроде int и complex,

являются именами типов. Обычно имя типа используется в описании для

спецификации другого имени. Единственные отличные от этого действия

над именем типа - это sizeof (для определения количества памяти,

которая требуется для хранения объекта типа) и new (для размещения

объекта типа в свободной памяти). Например:

main()

{

int* p = new int;

cout << "sizeof(int) = " << sizeof(int) "\n";

}

Имя типа можно также использовать для задания явного

преобразования одного типа в другой, например:

float f;

char* p;

//...

long ll = long(p); // преобразует p в long

int i = int(f); // преобразует f в int

2.3.1 Основные Типы

В C++ есть набор основных типов, которые соответствуют наиболее

общим основным единицам памяти компьютера и наиболее общим основным

способам их использования:

char

short int

int

long int

- стр 53 -

для представления целых различных размеров,

float

double

для представления чисел с плавающей точкой,

unsigned char

unsigned short int

unsigned int

unsigned long int

для представления беззнаковых целых, логических значений, битовых

массивов и т.п. Для большей компактности записи можно опускать int

в комбинациях из нескольких слов, что не меняет смысла; так, long

означает long int, и unsigned означает unsigned int. В общем, когда

в описании опущен тип, он предполагается int. Например:

const a = 1;

static x;

все определяют объект типа int.

Целый тип char наиболее удобен для хранения и обработки символов

на данном компьютере; обычно это 8-битовый байт. Размеры объектов

C++ выражаются в единицах размера char, поэтому по определению

sizeof(char)==1. В зависимости от аппаратного обеспечения char

является знаковым или беззнаковым целым. Тип unsigned char,

конечно, всегда беззнаковый, и при его использовании получаются

более переносимые программы, но из-за применения его вместо просто

char могут возникать значительные потери в эффективности.

Причина того, что предоставляется более чем один целый тип, более

чем один беззнаковый тип и более чем один тип с плавающей точкой, в

том, чтобы дать возможность программисту воспользоваться

характерными особенностями аппаратного обеспечения. На многих

машинах между различными разновидностями основных типов существуют

значительные различия в потребностях памяти, временах доступа к

памяти и временах вычислений. Зная машину обычно легко, например,

выбрать подходящий тип для конкретной переменной. Написать

действительно переносимую программу нижнего уровня сложнее. Вот

все, что гарантируется относительно размеров основных типов:

1==sizeof(char)<=sizeof(short)<= sizeof(int)<=sizeof(long)

sizeof(float)<=sizeof(double)

Однако обычно разумно предполагать, что в char могут храниться

целые числа в диапазоне 0...127 (в нем всегда могут храниться

символы машинного набора символов), что short и int имеют не менее

16 бит, что int имеет размер, соответствующий целой арифметике, и

что long имеет по меньшей мере 24 бита. Предполагать что-либо

помимо этого рискованно, и даже эти эмпирические правила применимы

не везде. Таблицу характеристик аппаратного обеспечения для

некоторых машин можно найти в #с.2.6.

Беззнаковые (unsigned) целые типы идеально подходят для

применений, в которых память рассматривается как массив битов.

Использование unsigned вместо int с тем, чтобы получить еще один

бит для представления положительных целых, почти никогда не

оказывается хорошей идеей. Попытки гарантировать то, что некоторые

значения положительны, посредством описания переменных как

- стр 54 -

unsigned, обычно срываются из-за правил неявного преобразования.

Например:

unsigned surprise = -1;

допустимо (но компилятор обязательно сделает предупреждение).

2.3.2 Неявное Преобразование Типа

Основные типы можно свободно сочетать в присваиваниях и

выражениях. Везде, где это возможно, значения преобразуются так,

чтобы информация не терялась. Точные правила можно найти в #с.6.6.

Существуют случаи, в которых информация может теряться или

искажаться. Присваивание значения одного типа переменной другого

типа, представление которого содержит меньшее число бит, неизбежно

является источником неприятностей. Допустим, например, что

следующая часть программы выполняется на машине с двоичным

дополнительным предсталением целых и 8-битовыми символами:

int i1 = 256+255;

char ch = i1 // ch == 255

int i2 = ch; // i2 == ?

В присваивании ch=i1 теряется один бит (самый значимый!), и ch

будет содержать двоичный код "все-единицы" (т.е. 8 единиц); при

присваивании i2 это никак не может превратиться в 511! Но каким же

может быть значение i2? На DEC VAX, где char знаковые, ответ будет

-1; на AT&T 3B-20, где char беззнаковые, ответ будет 255. В C++ нет

динамического (т.е. действующего во время исполнения) механизма для

разрешения такого рода проблемм, а выяснение на стадии компиляции

вообще очень сложно, поэтому программист должен быть внимателен.

2.3.3 Производные Типы

Другие типы модно выводить из основных типов (и типов,

определенных пользователем) посредством операций описания:

* указатель

& ссылка

[] вектор

() функция

и механизма определения структур. Например:

int* a;

float v[10];

char* p[20]; // вектор из 20 указателей на символ

void f(int);

struct str { short length; char* p; };

Правила построения типов с помощью этих операций подробно

объясняются в #с.8.3-4. Основная идея состоит в том, что описание

производного типа отражает его использование. Например:

- стр 55 -

int v[10]; // описывает вектор

i = v[3]; // использует элемент вектора

int* p; // описывает указатель

i = *p; // использует указываемый объект

Вся сложность понимания записи производных типов проистекает из

того, что операции * и & префиксные, а операции [] () постфиксные,

поэтому для формулировки типов в тех случаях, когда приоритеты

операций создают затруднения, надо использовать скобки. Например,

поскольку приоритет у [] выше, чем у *, то

int* v[10]; // вектор указателей

int (*p)[10]; // указатель на вектор

Большинство людей просто помнят, как выглядят наиболее обычные

типы.

Описание каждого имени, вводимого в программе, может оказаться

утомительным, особенно если их типы одинаковы. Но можно описывать в

одном описании несколько имен. В этом случае описание содержит

вместо одного имени список имен, разделенных запятыми. Например,

два имени можно описать так:

int x, y; // int x; int y;

При описании производных типов можно указать, что операции

применяются только к отдельным именам (а не ко всем остальным

именам в этом описании). Например:

int* p, y; // int* p; int y; НЕ int* y;

int x, *p; // int x; int* p;

int v[10], *p; // int v[10]; int* p;

Мнение автора таково, что подобные конструкции делают программу

менее удобочитаемой, и их следует избегать.

2.3.4 Тип void

Тип void (пустой) синтаксически ведет себя как основной тип.

Однако использовать его можно только как часть производного типа,

объектов типа void не существует. Он используется для того, чтобы

указать, что функция не возвращает значения, или как базовый тип

для указателей на объекты неизвестного типа.

void f() // f не возвращает значение

void* pv; // указатель на объект неизвестного типа

Переменной тиа void* можно присваивать указатель любого типа. На

первый взгляд это может показаться не особенно полезным, поскольку

void* нельзя разыменовать, но именно это ограничение и делает тип

void* полезным. Главным образом, он применяется для передачи

указателей функциям, которые не позволяют сделать предположение о

типе объекта, и для возврата из функций нетипизированных объектов.

Чтобы использовать такой объект, необходимо применить явное

- стр 56 -

преобразование типа. Подобные функции обычно находятся на самом

нижнем уровне системы, там, где осуществляется работа с основными

аппаратными ресурсами. Например:

void* allocate(int size); // выделить

void deallocate(void*); // освободить

f() {

int* pi = (int*)allocate(10*sizeof(int));

char* pc = (char*)allocate(10);

//...

deallocate(pi);

deallocate(pc);

}

2.3.5 Указатели

Для большинства типов T T* является типом указатель на T. То

есть, в переменной типа T* может храниться адрес объекта типа T.

Для указателей на вектора и указателей на функции вам, к сожалению,

придется пользоваться более сложной записью:

int* pi;

char** cpp; // указатель на указатель на char

int (*vp)[10]; // указатель на вектор из 10 int'ов

int (*fp)(char, char*); // указатель на функцию

// получающую параметры (char, char*)

// и возвращающую int

Основная операция над указателем - разыменование, то есть ссылка на

объект, на который указывает указатель. Эта операция также

называется косвенным обращением. Операция разыменования - это

унарное * (префиксное). Например:

char c1 = 'a';

char* p = &c1; // в p хранится адрес c1

char c2 = *p; // c2 = 'a'

Переменная, на которую указывает p,- это c1, а значение, которое

хранится в c1, это 'a', поэтому присваиваемое c2 значение *p есть

'a'.

Над указателями можно осуществлять некоторые арифметические

действия. Вот, например, функция, подсчитывающая число символов в

строке (не считая завершающего 0):

int strlen(char* p)

{

int i = 0;

while (*p++) i++;

return i;

}

Другой способ найти длину состоит в том, чтобы сначала найти конец

строки, а затем вычесть адрес начала строки из адреса ее конца:

- стр 57 -

int strlen(char* p)

{

char* q = p;

while (*q++) ;

return q-p-1;

}

Очень полезными могут оказаться указатели на функции; они

обсуждаются в #4.6.7.

2.3.6 Вектора

Для типа T T[size] является типом "вектор из size элементов типа

T". Элементы индексируются (нумеруются) от 0 до size-1. Например:

float v[3]; // вектор из трех float: v[0], v[1], v[2]

int a[2][5]; // два вектора из пяти int

char* vpc; // вектор из 32 указателей на символ

Цикл для печати целых значений букв нижнего регистра можно было бы

написать так:

extern int strlen(char*);

char alpha[] = "abcdefghijklmnoprstuvwxyz";

main()

{

int sz = strlen(alpha);

for (int i=0; i. Функция strlen() использовалась

для подсчета числа символов в alpha; вместо этого можно было

использовать значение размера alpha (#2.4.4). Если применяется

набор символов ASCII, то выдача выглядит так:

'a' = 97 = 0141 = 0x61

'b' = 98 = 0142 = 0x62

'c' = 99 = 0143 = 0x63

...

- стр 58 -

Заметим, что задавать размер вектора alpha необязательно;

компилятор считает число символов в символьной строке, указанной в

качестве инициализатора. Использование строки как инициализатора

для вектора символов - удобное, но к сожалению и единственное

применение строк. Аналогичное этому присваивание строки вектору

отсутствует. Например:

char v[9];

v = "строка"; // ошибка

ошибочно, поскольку присваивание не определено для векторов.

Конечно, для инициализации символьных массивов подходят не только

строки. Для остальных типов нужно применять более сложную запись.

Эту запись можно использовать и для символьных векторов. Например:

int v1[] = { 1, 2, 3, 4 };

int v2[] = { 'a', 'b', 'c', 'd' };

char v3[] = { 1, 2, 3, 4 };

char v4[] = { 'a', 'b', 'c', 'd' };

Заметьте, что v4 - вектор из четырех (а не пяти) символов; он не

оканчивается нулем, как того требуют соглашение и библиотечные

подпрограммы. Обычно применение такой записи ограничивается

статическими объектами.

Многомерные массивы представляются как вектора векторов, и

применение записи через запятую, как это делается в некоторых

других языках, дает ошибку при компиляции, так как запятая (,)

является операцией последования (см. #3.2.2). Попробуйте, например,

сделать так:

int bad[5,2]; // ошибка

и так:

int v[5][2];

int bad = v[4,1]; // ошибка

int good = v[4][1]; // ошибка

Описание

char v[2][5];

описывает вектор из двух элементов, каждый из которых является

вектором типа char[5]. В следующем примере первый из этих векторов

инициализируется первыми пятью буквами, а второй - первыми пятью

цифрами.

- стр 59 -

char v[2][5] = {

'a', 'b', 'c', 'd', 'e',

'0', '1', '2', '3', '4'

}

main() {

for (int i = 0; i<2; i++) {

for (int j = 0; j<5; j++)

cout << "v[" << i << "][" << j

<< "]=" << chr(v[i][j]) << " ";

cout << "\n";

}

}

это дает в результате

v[0][0]=a v[0][1]=b v[0][2]=c v[0][3]=d v[0][4]=e

v[1][0]=0 v[1][1]=1 v[1][2]=2 v[1][3]=3 v[1][4]=4

2.3.7 Указатели и Вектора

Указатели и вектора в C++ связаны очень тесно. Имя вектора можно

использовать как указатель на его первый элемент, поэтому пример с

алфавитом можно было написать так:

char alpha[] = "abcdefghijklmnopqrstuvwxyz";

char* p = alpha;

char ch;

while (ch = *p++)

cout << chr(ch) << " = " << ch

<< " = 0" << oct(ch) << "\n";

Описание p можно было также записать как

char* p = &alpha[0];

Эта эквивалентность широко используется в вызовах функций, в

которых векторный параметр всегда передается как указатель на

первый элемент вектора; так, в примере

extern int strlen(char*);

char v[] = "Annemarie";

char* p = v;

strlen(p);

strlen(v);

функции strlen в обоих вызовах передается одно и то же значение.

Вся штука в том, что этого невозможно избежать; то есть не

существует способа описать функцию так, чтобы вектор v в вызове

функции копировался (#4.6.3).

Результат применения к указателям арифметических операций +, -,

++ или -- зависит от типа объекта, на который они указывают. Когда

к указателю p типа T* применяется арифметическая операция,

- стр 60 -

предполагается, что p указывает на элемент вектора объектов типа T;

p+1 означает следующий элемент этого вектора, а p-1 - предыдущий

элемент. Отсюда следует, что значение p+1 будет на sizeof(T) больше

значения p. Например, выполнение

main()

{

char cv[10];

int iv[10];

char* pc = cv;

int* pi = iv;

cout << "char* " << long(pc+1)-long(pc) << "\n";

cout << "int* " << long(ic+1)-long(ic) << "\n";

}

дает

char* 1

int* 4

поскольку на моей машине каждый символ занимает один байт, а каждое

целое занимает четыре байта. Перед вычитанием значения указателей

преобразовывались к типу long с помощью явного преобразования типа

(#3.2.5). Они преобразовывались к long, а не к "очевидному" int,

поскольку есть машины, на которых указатель не влезет в int (то

есть, sizeof(int)

2.3.8 Структуры

Вектор есть совокупность элементов одного типа; struct является

совокупностью элементов (практически) произвольных типов. Например:

- стр 61 -

struct address { // почтовый адрес

char* name; // имя "Jim Dandy"

long number; // номер дома 61

char* street; // улица "South Street"

char* town; // город "New Providence"

char* state[2]; // штат 'N' 'J'

int zip; // индекс 7974

}

определяет новый тип, названный address (почтовый адрес), состоящий

из пунктов, требующихся для того, чтобы послать кому-нибудь

корреспонденцию (вообще говоря, address не является достаточным для

работы с полным почтовым адресом, но в качетве примера

достаточен). Обратите внимание на точку с запятой в конце; это одно

из очень немногих мест в C++, где необходимо ставить точку с

запятой после фигурной скобки, поэтому люди склонны забывать об

этом.

Переменные типа address могут описываться точно также, как другие

переменные, а доступ к отдельным членам получается с помощью

операции . (точка). Например:

address jd;

jd.name = "Jim Dandy";

jd.number = 61;

Запись, которая использовалась для инициализации векторов, можно

применять и к переменным структурных типов. Например:

address jd = {

"Jim Dandy",

61, "South Street",

"New Providence", {'N','J'}, 7974

};

Однако обычно лучше использовать конструктор (#5.2.4). Заметьте,

что нельзя было бы инициализировать jd.state строкой "NJ". Строки

оканчиваются символом '\0', поэтому в "NJ" три символа, то есть на

один больше, чем влезет в jd.state.

К структурным объектам часто обращаются посредством указателей

используя операцию ->. Например:

void print_addr(address* p)

{

cout << p->name << "\n"

<< p->number << " " << p->street << "\n"

<< p->town << "\n"

<< chr(p->state[0]) << chr(p->state[1])

<< " " << p->zip << "\n";

}

Объекты типа структур можно присваивать, передавать как параметры

функции и возвращать из функции в качестве результата. Например:

- стр 62 -

address current;

address set_current(address next)

{

address prev = current;

current = next;

return prev;

}

Остальные осмысленные операции, такие как сравнение (== и !=) не

определены. Однако пользователь может определить эти операции; см.

Главу 6.

Размер объекта структурного типа нельзя вычислить просто как

сумму его членов. Причина этого состоит в том, что многие машины

требуют, чтобы объекты определенных типов выравнивались в памяти

только по некоторым зависящим от архитектуры границам (типичный

пример: целое должно быть выравнено по границе слова) или просто

гораздо более эффективно обрабатывают такие объекты, если они

выравнены в машине. Это приводит к "дырам" в структуре. Например,

(на моей машине) sizeof(address) равен 24, а не 22, как можно было

ожидать.

Заметьте, что имя типа становится доступным сразу после того, как

оно встретилось, а не только после того, как полностью просмотрено

все описание. Например:

struct link{

link* previous;

link* successor;

}

Новые объекы структурного типа не могут быть описываться, пока все

описание не просмотрено, поэтому

struct no_good {

no_good member;

};

является ошибочным (компилятор не может установить размер no_good).

Чтобы дать возможность двум (или более) структурным типам ссылаться

друг на друга, можно просто описать имя как имя структурного типа.

Например:

struct list; // должна быть определена позднее

struct link {

link* pre;

link* suc;

link* member_of;

};

struct list {

link* head;

}

Без первого описания list описание link вызвало бы к синтаксическую

ошибку.

- стр 63 -

2.3.9 Эквивалентность типов

Два структурных типа являются различными даже когда они имеют

одни и те же члены. Например:

struct s1 { int a; };

struct s2 { int a; };

есть два разных типа, поэтому

s1 x;

s2 y = x; // ошибка: несоответствие типов

Структурные типы отличны также от основных типов, поэтому

s1 x;

int i = x; // ошибка: несоответствие типов

Однако, существует механизм для описания нового имени для типа

без введения нового типа. Описание с префиксом typedef описывает не

новую переменную данного типа, а новое имя этого типа. Например:

typedef char* Pchar;

Pchar p1, p2;

char* p3 = p1;

Это может служить удобной сокращенной записью.

2.3.10 Ссылки

Ссылка является другим именем объекта. Главное применение ссылок

состоит в спецификации операций для типов, определяемых

пользователем; они обсуждаются в Главе 6. Они могут также быть

полезны в качестве параметров функции. Запись x& означает ссылка на

x. Например:

int i = 1;

int& r = i; // r и i теперь ссылаются на один int

int x = r // x = 1

r = 2; // i = 2;

Ссылка должна быть инициализирована (должно быть что-то, для чего

она является именем). Заметьте, что инициализация ссылки есть нечто

совершенно отличное от присваивания ей.

Вопреки ожиданиям, ниодна операция на ссылку не действует.

Например,

int ii = 0;

int& rr = ii;

rr++; // ii увеличивается на 1

допустимо, но rr++ не увеличивает ссылку; вместо этого ++

применяется к int, которым оказывается ii. Следовательно, после

инициализации значение ссылки не может быть изменено; она всегда

ссылается на объект, который ей было дано обозначать (денотировать)

- стр 64 -

при инициализации. Чтобы получить указатель на объект, денотируемый

ссылкой rr, можно написать &rr.

Очевидным способом реализации ссылки является константный

указатель, который разыменовывается при каждом использовании. Это

делает инициализацию ссылки тривиальной, когда инициализатор

является lvalue (объектом, адрес которого вы можете взять, см.

#с.5). Однако инициализатор для &T не обязательно должен быть

lvalue, и даже не должен быть типа T. В таких случаях:

[1] Во-первых, если необходимо, применяются преобразование типа

(#с.6.6-8,#с.8.5.6);

[2] Затем полученное значение помещается во временную переменную;

и

[3] Наконец, ее адрес используется в качестве значения

инициализатора.

Рассмотрим описание

double& dr = 1;

Это интерпретируется так:

double* drp; // ссылка, представленная как указатель

double temp;

temp = double(1);

drp = &temp;

Ссылку можно использовать для реализации функции, которая, как

предполагается, изменяет значение своего параметра.

int x = 1;

void incr(int& aa) { aa++; }

incr(x) // x = 2

По определению семантика передачи параметра та же, что семантика

инициализации, поэтому параметр aa функции incr становится другим

именем для x. Однако, чтобы сделать программу читаемой, в

большинстве случаев лучше всего избегать функций, которые изменяют

значение своих параметров. Часто предпочтительно явно возвращать

значение из функции или требовать в качестве параметра указатель:

int x = 1;

int next(int p) { return p+1; }

x = next(x); // x = 2

void inc(int* p) { (*p)++; }

inc(&x); // x = 3

Ссылки также можно применять для определения функций, которые

могут использоваться и в левой, и в правой части присваивания.

Опять, большая часть наиболее интересных случаев этого

обнаруживается в проектировании нетривиальных определяемых

пользователем типов. Для примера давайте определим простой

ассоциативный массив. Вначале мы определим структуру пары следующим

образом:

- стр 65 -

struct pair {

char* name;

int val;

};

Основная идея состоит в том, что строка имеет ассоциированное с

ней целое значение. Легко определить функцию поиска find(), которая

поддерживает структуру данных, состоящую из одного pair для каждой

отличной отличной от других строки, которая была ей представлена.

Для краткости представления используется очень простая (и

неэффективная) реализация:

const large = 1024;

static pair vec[large+1};

pair* find(char* p)

/*

поддерживает множество пар "pair":

ищет p, если находит, возвращает его "pair",

иначе возвращает неиспользованную "pair"

*/

{

for (int i=0; vec[i].name; i++)

if (strcmp(p,vec[i].name)==0) return &vec[i];

if (i == large) return &vec[large-1];

return &vec[i];

}

Эту функцию может использовать функция value(), реализующая

массив целых, индексированый символьными строками (вместо обычного

способа):

int& value(char* p)

{

pair* res = find(p);

if (res->name == 0) { // до сих пор не встречалось:

res->name = new char[strlen(p)+1]; // инициализировать

strcpy(res->name,p);

res->val = 0; // начальное значение 0

}

return res->val;

}

Для данной в качестве параметра строки value() находит целый объект

(а не значение соответствующего целого); после чего она возвращает

ссылку на него. Ее можно использовать, например, так:

- стр 66 -

const MAX = 256; // больше самого большого слова

main()

// подсчитывает число вхождений каждого слова во вводе

{

char buf[MAX];

while (cin>>buf) value(buf)++;

for (int i=0; vec[i].name; i++)

cout << vec[i].name << ": " << vec [i].val << "\n";

}

На каждом проходе цикл считывает одно слово из стандартной строки

ввода cin в buf (см. Главу 8), а затем обновляет связанный с ней

счетчик спомощью find(). И, наконец, печатается полученная таблица

различных слов во введенном тексте, каждое с числом его

встречаемости. Например, если вводится

aa bb bb aa aa bb aa aa

то программа выдаст:

aa: 5

bb: 3

Легко усовершенствовать это в плане собственного типа

ассоциированного массива с помощью класса с перегруженной операцией

(#6.7) выбора [].

2.3.11 Регистры

Во многих машинных архитектурах можно обращаться к (небольшим)

объектам заметно быстрее, когда они помещены в регистр. В идеальном

случае компилятор будет сам определять оптимальную стратегию

использования всех регистров, доступных на машине, для которой

компилируется программа. Однако это нетривиальная задача, поэтому

иногда программисту стоит дать подсказку компилятору. Это делается

с помощью описания объекта как register. Например:

register int i;

register point cursor;

register char* p;

Описание register следует использовать только в тех случаях, когда

эффективность действительно важна. Описание каждой переменной как

register засорит текст программы и может даже увеличить время

выполнения (обычно воспринимаются все инструкции по помещению

объекта в регистр или удалению его оттуда).

Невозможно получить адрес имени, описанного как register, регистр

не может также быть глобальным.

- стр 67 -

2.4 Константы

C++ дает возможность записи значений основных типов: символьных

констант, целых констант и констант с плавающей точкой. Кроме того,

ноль (0) может использоваться как константа любого указательного

типа, и символьные строки являются константами типа char[]. Можно

также задавать символические константы. Символическая константа -

это имя, значение которого не может быть изменено в его области

видимости. В C++ имеется три вида символических констант: (1)

любому значению любого типа можно дать имя и использовать его как

константу, добавив к его описанию ключевое слово const; (2)

множество целых констант может быть определено как перечисление; и

(3) любое имя вектора или функции является константой.

2.4.1 Целые Константы

Целые константы предстают в четырех обличьях: десятичные,

восьмеричные, шестнадцатиричные и символьные константы. Десятичные

используются чаще всего и выглядят так, как можно было бы ожидать:

0 1234 976 12345678901234567890

Десятичная константа имеет тип int, при условии, что она влезает в

int, в противном случае ее тип long. Компилятор должен

предупреждать о константах, которые слишком длинны для

представления в машине.

Константа, которая начинается нулем за которым идет x (0x),

является шестнадцатиричным числом (с основанием 16), а константа,

которая начинается нулем за которым идет цифра, является

восьмеричным числом (с основанием 8). Вот примеры восьмеричных

констант:

0 02 077 0123

их десятичные эквиваленты - это 0, 2, 63, 83. В шестнадцатиричной

записи эти константы выглядят так:

0x0 0x2 0x3f 0x53

Буквы a, b, c, d, e и f, или их эквиваленты в верхнем регистре,

используются для представления чисел 10, 11. 12, 13, 14 и 15,

соответственно. Восьмеричная и шестнадцатиричная записи наиболее

полезны для записи набора битов; применение этих записей для

выражения обычных чисел может привести к неожиданностям. Например,

на машине, где int представляется как двоичное дополнительное

шестнадцатеричное целое, 0xffff является отрицательным десятичным

числом -1; если бы для представления целого использовалось большее

число битов, то оно было бы числом 65535.

2.4.2 Константы с Плавающей Точкой

Константы с плавающей точкой имеют тип double. Как и в предыдущем

случае, компилятор должен предупреждать о константах с плавающей

- стр 68 -

точкой, которые слишком велики, чтобы их можно было представить.

Вот некоторые константы с плавающей точкой:

1.23 .23 0.23 1. 1.0 1.2e10 1.23e-15

Заметьте, что в середине константы с плавающей точкой не может

встречаться пробел. Например, 65.43 e-21 является не константой с

плавающей точкой, а четыремя отдельными лексическими символами

(лексемами):

65.43 e - 21

и вызовет синтаксическую ошибку.

Если вы хотите иметь константу с плавающей точкой типа float, вы

можете определить ее так (#2.4.6):

const float pi = 3.14159265;

2.4.3 Символьные Константы

Хотя в C++ и нет отдельного символьного типа данных, точнее,

символ может храниться в целом типе, в нем для символов имеется

специальная и удобная запись. Символьная константа - это символ,

заключенный в одинарные кавычки; например, 'a' или '0'. Такие

символьные константы в действительности являются символическими

константами для целого значения символов в наборе символов той

машины, на которой будет выполняться программа (который не

обязательно совпадает с набором символов, применяемом на том

компьютере, где программа компилируется). Поэтому, если вы

выполняетесь на машине, использующей набор символов ASCII, то

значением '0' будет 48, но если ваша машина использует EBCDIC, то

оно будет 240. Употребление символьных констант вместо десятичной

записи делает программу более переносимой. Несколько символов также

имеют стандартные имена, в которых обратная косая \ используется

как escape-символ:

'\b' возрат назад

'\f' перевод формата

'\n' новая строка

'\r' возврат каретки

'\t' горизонтальная табуляция

'\v' вертикальная табуляция

'\\' обратная косая (обратный слэш)

'\'' одинарная кавычка

'\"' двойная кавычка

'\0' null, пустой символ, целое значение 0

Вопреки их внешнему виду каждое является одним символом. Можно

также представлять символ одно-, дву- или трехзначным восьмеричным

числом (символ \, за которым идут восьмеричные цифры), или одно-,

дву- или трехзначным шестнадцатиричным числом (\x, за которым идут

шестнадцатиричные цифры). Например:

- стр 69 -

'\6' '\x6' 6 ASCII ack

'\60' '\x30' 48 ASCII '0'

'\137' '\x05f' 95 ASCII '_'

Это позволяет представлять каждый символ из машинного набора

символов, и в частности вставлять такие символы в символьные строки

(см. следующий раздел). Применение числовой записи для символов

делает программу непереносимой между машинами с различными наборами

символов.

2.4.4 Строки

Строковая константа - это последовательность символов,

заключенная в двойные кавычки:

"это строка"

Каждая строковая константа содержит на один символ больше, чем

кажется; все они заканчиваются пустым символом '\0' со значением 0.

Например:

sizeof("asdf")==5;

Строка имеет тип "вектор из соответствующего числа символов",

поэтому "asdf" имеет тип char[5]. Пустая строка записывается "" (и

имеет тип char[1]). Заметьте, что для каждой строки s

strlen(s)==sizeof(s)-1, поскольку strlen() не учитывает завершающий

0.

Соглашение о представлении неграфических символов с обратной

косой можно использовать также и внутри строки. Это дает

возможность представлять в строке двойные кавычки и escape-символ

\. Самым обычным символом этого рода является, безусловно, символ

новой строки '\n'. Например:

cout << "гудок в конце сообщения\007\n"

где 7 - значение ASKII символа bel (звонок).

В строке невозможно иметь "настоящую" новую строку:

"это не строка,

а синтаксическая ошибка"

Однако в строке может стоять обратная косая, сразу после которой

идет новая строка; и то, и другое будет проигнорировано. Например:

cout << "здесь все \

ok"

напечатает

здесь все ok

Новая строка, перед которой идет escape (обратная косая), не

приводит к появлению в строке новой строки, это просто

договоренность о записи.

- стр 70 -

В строке можно иметь пустой символ, но большинство программ не

будет предполагать, что есть символы после него. Например, строка

"asdf\000hjkl" будет рассматриваться стандартными функциями, вроде

strcpy() и strlen(), как "asdf".

Вставляя численную константу в строку с помощью восьмеричной или

шестнадцатиричной записи благоразумно всегда использзовать число из

трех цифр. Читать запись достаточно трудно и без необходимости

беспокоиться о том, является ли символ после константы цифрой или

нет. Разберите эти примеры:

char v1[] = "a\x0fah\0129"; // 'a' '\xfa' 'h' '\12' '9'

char v2[] = "a\xfah\129"; // 'a' '\xfa' 'h' '\12' '9'

char v3[] = "a\xfad\127"; // 'a' '\xfad' '\127'

Имейте в виду, что двузначной шестнадцатиричной записи на машинах с

9-битовым байтом будет недостаточно.

2.4.5 Ноль

Ноль (0) можно употреблять как константу любого целого,

плавающего или указательного типа. Никакой объект не размещается по

адресу 0. Тип нуля определяется контекстом. Обычно (но не

обязательно) он представляется набором битов все-нули

соответствующей длины.

2.4.6 Const

Ключевое слово const может добавляться к описанию объекта, чтобы

сделать этот объект константой, а не переменной. Например:

const int model = 145;

const int v[] = { 1, 2, 3, 4 };

Поскольку константе ничего нельзя присвоить, она должна быть

инициализирована. Описание чего-нибудь как const гарантирует, что

его значение не изменится в области видимости:

model = 145; // ошибка

model++; // ошибка

Заметьте, что const изменяет тип, то есть ограничивает способ

использования объекта, вместо того, чтобы задавать способ

размещения константы. Поэтому например вполне разумно, а иногда и

полезно, описывать функцию как возвращающую const:

const char* peek(int i)

{

return private[i];

}

Функцию вроде этой можно было бы использовать для того, чтобы

давать кому-нибудь читать строку, которая не может быть затерта или

переписана (этим кем-то).

- стр 71 -

С другой стороны, компилятор может несколькими путями

воспользоваться тем, что объект является константой (конечно, в

зависимости от того, насколько он сообразителен). Самое очевидное -

это то, что для константы не требуется выделять память, поскольку

компилятор знает ее значение. Кроме того, инициализатор константы

часто (но не всегда) является константным выражением, то есть он

может быть вычислен на стадии компиляции. Однако для вектора

констант обычно приходится выделять память, поскольку компилятор в

общем случае не может вычислить, на какие элементы вектора сделаны

ссылки в выражениях. Однако на многих машинах даже в этом случае

может достигаться повышение эффективности путем размещения векторов

констант в память, доступную только для чтения.

Использование указателя вовлекает два объекта: сам указатель и

указываемый объект. Снабжение описания указателя "префиксом" const

делает объект, но не сам указатель, константой. Например:

const char* pc = "asdf"; // указатель на константу

pc[3] = 'a'; // ошибка

pc = "ghjk"; // ok

Чтобы описать сам указатель, а не указываемый объект, как

константный, используется операция const*. Например:

char *const cp = "asdf"; // константный указатель

cp[3] = 'a'; // ok

cp = "ghjk"; // ошибка

Чтобы сделать константами оба объекта, их оба нужно описать const.

Например:

const char *const cpc = "asdf"; // const указатель на const

cpc[3] = 'a'; // ошибка

cpc = "ghjk"; // ошибка

Объект, являющийся контстантой при доступе к нему через один

указатель, может быть переменной, когда доступ осуществляется

другими путями. Это в частноси полезно для параметров функции.

Посредством описания параметра указателя как const функции

запрещается изменять объект, на который он указывает. Например:

char* strcpy(char* p, const char* q); // не может изменить q

Указателю на константу можно присваивать адрес переменной,

поскольку никакого вреда от этого быть не может. Однако нельзя

присвоить адрес константы указателю, на который не было наложено

ограничение, поскольку это позволило бы изменить значение объекта.

Например:

int a = 1;

const c = 2;

const* p1 = &c; // ok

const* p2 = &a; // ok

int* p3 = &c; // ошибка

*p3 = 7; // меняет значение c

Как обычно, если тип в описании опущен, то он предполагается int.

- стр 72 -

2.4.7 Перечисления

Есть другой метод определения целых констант, который иногда

более удобен, чем применение const. Например:

enum { ASM, AUTO, BREAK };

определяет три целых константы, называемы перечислителями, и

присваивает им значения. Поскольку значения перечислителей по

умолчанию присваиваются начиная с 0 в порядке возрастания, это

эквивалентно записи:

const ASM = 0;

const AUTO = 1;

const BREAK = 2;

Перечисление может быть именованным. Например:

enum keyword { ASM, AUTO, BREAK };

Имя перечисления становится синонимом int, а не новым типом.

Описание переменной keyword, а не просто int, может дать как

программисту, так и компилятору подсказку о том, что использование

преднамеренное. Например:

keyword key;

switch (key) {

case ASM:

// что-то делает

break;

case BREAK:

// что-то делает

break;

}

побуждает компилятор выдать предупреждение, поскольку только два

значения keyword из трех используются.

Можно также задавать значения перечислителей явно. Например:

enum int16 {

sign=0100000, // знак

most_significant=040000, // самый значимый

least_significant=1 // наименее значимый

};

Такие значения не обязательно должны быть различными, возрастающими

или положительными.

2.5 Экономия Пространства

В ходе программирования нетривиальных разработок неизбежно

наступает время, когда хочется иметь больше пространства памяти,

чем имеется или отпущено. Есть два способа выжать побольше

пространства из того, что доступно:

- стр 73 -

[1] Помещение в байт более одного небольшого объекта; и

[2] Использование одного и того же пространства для хранения

разных объектов в разное время.

Первого можно достичь с помощью использования полей, второго -

через использование объединений. Эти конструкции описываются в

следующих разделах. Поскольку обычное их применение состоит чисто в

оптимизации программы, и они в большинстве случаев непереносимы,

программисту следует дважды подумать, прежде чем использовать их.

Часто лучше изменить способ управления данными; например, больше

полагаться на динамически выделяемую память (#3.2.6) и меньше на

заранее выделенную статическую память.

2.5.1 Поля

Использование char для представления двоичной переменной,

например, переключателя включено/выключено, может показаться

экстравагантным, но char является наименьшим объектом, который в

C++ может выделяться независимо. Можно, однако, сгруппировать

несколько таких крошечных переменных вместе в виде полей struct.

Член определяется как поле путем указания после его имени числа

битов, которые он занимает. Допустимы неименованные поля; они не

влияют на смысл именованных полей, но неким машинно-зависимым

образом могут улучшить размещение:

struct sreg {

unsigned enable : 1;

unsigned page : 3;

unsigned : 1; // неиспользуемое

unsigned mode : 2;

unsigned : 4: // неиспользуемое

unsigned access : 1;

unsigned length : 1;

unsigned non_resident : 1;

}

Получилось размещение регистра 0 сосояния DEC PDP11/45 (в

предположении, что поля в слове размещаются слева направо). Этот

пример также иллюстрирует другое основное применение полей:

именовать части внешне предписанного размещения. Поле должно быть

целого типа и используется как другие целые, за исключением того,

что невозможно взять адрес поля. В ядре операционной системы или в

отладчике тип sreg можно было бы использовать так:

sreg* sr0 = (sreg*)0777572;

//...

if (sr->access) { // нарушение доступа

// чистит массив

sr->access = 0;

}

Однако применение полей для упаковки нескольких переменных в один

байт не обязательно экономит пространство. Оно экономит

пространство, занимаемое данными, но объем кода, необходимого для

манипуляции этими переменными, на большинстве машин возрастает.

Известны программы, которые значительно сжимались, когда двоичные

- стр 74 -

переменные преобразовывались из полей бит в символы! Кроме того,

доступ к char или int обычно намного быстрее, чем доступ к полю.

Поля - это просто удобная и краткая запись для применения

логических операций с целью извлечения информации из части слова

или введения информации в нее.

2.5.2 Объединения

Рассмотрим проектирование символьной таблицы, в которой каждый

элемент содержит имя и значение, и значение может быть либо

строкой, либо целым:

struct entry {

char* name;

char type;

char* string_value; // используется если type == 's'

int int_value; // используется если type == 'i'

};

void print_entry(entry* p)

{

switch p->type {

case 's':

cout << p->string_value;

break;

case 'i':

cout << p->int_value;

break;

default:

cerr << "испорчен type\n";

break;

}

}

Поскольку string_value и int_value никогда не могут

использоваться одновременно, ясно, что пространство пропадает

впустую. Это можно легко исправить, указав, что оба они должны быть

членами union (объединения); например, так:

struct entry {

char* name;

char type;

union {

char* string_value; // используется если type == 's'

int int_value; // используется если type == 'i'

};

};

Это оставляет всю часть программы, использующую entry, без

изменений, но обеспечивает, что при размещении entry string_value и

int_value имеют один и тот же адрес. Отсюда следует, что все члены

объединения вместе занимают лишь столько памяти, сколько занимает

наибольший член.

Использование объединений таким образом, чтобы при чтении

значения всегда применялся тот член, с применением которого оно

- стр 75 -

записывалось, совершенно оптимально. Но в больших программах

непросто гарантировать, что объединения используются только таким

образом, и из-за неправильного использования могут появляться

трудно уловимые ошибки. Можно капсулизировать объединение таким

образом, чтобы соответствие между полем типа и типами членов было

гарантированно правильным (#5.4.6).

Объединения иногда испольуют для "преобразования типов" (это

делают главным образом программисты, воспитанные на языках, не

обладающих средствами преобразования типов, где жульничество

является необходимым). Например, это "преобразует" на VAX'е int в

int*, просто предполагая побитовую эквивалентность:

struct fudge {

union {

int i;

int* p;

};

};

fudge a;

a.i = 4096;

int* p = a.p; // плохое использование

Но на самом деле это совсем не преобразование: на некоторых

машинах int и int* занимают неодинаковое количество памяти, а на

других никакое целое не может иметь нечетный адрес. Такое

применение объединений непереносимо, а есть явный способ указать

преобразование типа (#3.2.5).

Изредка объединения умышленно применяют, чтобы избежать

преобразования типов. Можно, например, использовать fudge, чтобы

узнать представление указателя 0:

fudge.p = 0;

int i = fudge.i; // i не обязательно должно быть 0

Можно также дать объединению имя, то есть сделать его

полноправным типом. Например, fudge можно было бы описать так:

union fudge {

int i;

int* p;

};

и использовать (неправильно) в точности как раньше. Имеются также и

оправданные применения именованных объединений; см. #5.4.6.

2.6 Упражнения

1. (*1) Заставьте работать программу с "Hello, world" (1.1.1).

2. (*1) Для каждого описания в #2.1 сделайте следующее: Если

описание не является определением, напишите для него

определение. Если описание является определением, напишите для

него описание, которое при этом не является определением.

3. (*1) Напишите описания для: указателя на символ; вектора из 10

целых; ссылки на вектор из 10 целых; указателя на вектор из

- стр 76 -

символьных строк; указателя на указатель на символ;

константного целого; указателя на константное целое; и

константного указателя на целое. Каждый из них

инициализируйте.

4. (*1.5) Напишите программу, которая печатает размеры основных и

указательных типов. Используйте операцию sizeof.

5. (*1.5) Напишите программу, которая печатает буквы 'a'...'z' и

цифры '0'...'9' и их числовые значения. Сделайте то же для

остальных печатаемых символов. Сделайте то же, но используя

шестнадцатиричную запись.

6. (*1) Напечатайте набор битов, которым представляется указатель

0 на вашей системе. Подсказка: #2.5.2.

7. (*1.5) Напишите функцию, печатающую порядок и мантиссу

параметра типа double.

8. (*2) Каковы наибольшие и наименьшие значения, на вашей

системе, следующих типов: char, short, int, long, float,

double, unsigned, char*, int* и void*? Имеются ли

дополнительные ограничения на принимаемые ими значения? Может

ли, например, int* принимать нечетное значение? Как

выравниваются в памяти объекты этих типов? Может ли, например,

int иметь нечетный адрес?

9. (*1) Какое самое длинное локальное имя можно использовать в

C++ программе в вашей системе? Какое самое длинное внешнее имя

можно использовать в C++ программе в вашей системе? Есть ли

какие-нибудь ограничения на символы, которые можно употреблять

в имени?

10. (*2) Определите one следующим образом:

const one = 1;

Попытайтесь поменять значение one на 2. Определите num

следующим образом:

const num[] = { 1, 2 };

Попытайтесь поменять значение num[1] на 2.

11. (*1) Напишите функцию, переставляющую два целых (меняющую

значения). Используйте в качесте типа параметра int*. Напишите

другую переставляющую функцию, использующую в качесте типа

параметра int&.

12. (*1) Каков размер вектора str в следующем примере:

char str[] = "a short string";

Какова длина строки "a short string"?

13. (*1.5) Определите таблицу названий месяцев года и числа дней

в них. Выведите ее. Сделайте это два раза: один раз используя

вектор для названий и вектор для числа дней, и один раз

используя вектор структур, в каждой из которых хранится

название месяца и число дней в нем.

14. (*1) С помощью typedef определите типы: беззнаковый char;

константный беззнаковый char; указатель на целое; указатель на

указатель на char; указатель на вектора символов; вектор из 7

целых указателей; указатель на вектор из 7 целых указателей;

и вектор из 8 векторов из 7 целых указателей.

* Глава 3 *

Выражения и операторы

С другой стороны,

мы не можем игнорировать эффективность

- Джон Бентли

C++ имеет небольшой, но гибкий набор различных видов операторов

для контроля потока управления в программе и богатый набор операций

для манипуляции данными. С наиболее общепринятыми средствами вас

познакомит один законченный пример. После него приводится

резюмирующий обзор выражений и с довольно подробно описываются

явное описание типа и работа со свободной памятью. Потом

представлена краткая сводка операций, а в конце обсуждаются стиль

выравнивания* и комментарии.

3.1 Настольный калькулятор

С операторами и выражениями вас познакомит приведенная здесь

программа настольного калькулятора, предоставляющего четыре

стандартные арифметические опреации над числами с плавающей точкой.

Пользователь может также определять переменные. Например, если

вводится

r=2.5

area=pi*r*r

(pi определено заранее), то программа калькулятора напишет:

2.5

19.635

где 2.5 - результат первой введенной строки, а 19.635 - результат

второй.

Калькулятор состоит из четырех основных частей: программы

синтаксического разбора (parser'а), функции ввода, таблицы имен и

управляющей программы (драйвера). Фактически, это миниатюрный

компилятор, в котором программа синтаксического разбора производит

синтаксический анализ, функция ввода осуществляет ввод и

лексический анализ, в таблице имен хранится долговременная

информация, а драйвер распоряжается инициализцией, выводом и

обработкой ошибок. Можно было бы многое добавить в этот

калькулятор, чтобы сделать его более полезным, но в существующем

виде эта программа и так достаточно длинна (200 строк), и большая

часть дополнительных возможностей просто увеличит текст программы

не давая дополнительного понимания применения C++.

____________________

* Нам неизвестен русскоязычный термин, эквивалентный английскому

indentation. Иногда это называется отступами. (прим. перев.)

- стр 78 -

3.1.1 Программа синтаксического разбора

Вот грамматика языка, допускаемого калькулятором:

program:

END // END - это конец ввода

expr_list END

expr_list:

expression PRINT // PRINT - это или '\n' или ';'

expression PRINT expr_list

expression:

expression + term

expression - term

term

term:

term / primary

term * primary

primary

primary:

NUMBER // число с плавающей точкой в C++

NAME // имя C++ за исключением '_'

NAME = expression

- primary

( expression )

Другими словами, программа есть последовательность строк. Каждая

строка состоит из одного или более выражений, разделенных запятой.

Основными элементами выражения являются числа, имена и операции *,

/, +, - (унарный и бинарный) и =. Имена не обязательно должны

описываться до использования.

Используемый метод синтаксического анализа обычно называется

рекурсивным спуском; это популярный и простой нисходящий метод. В

таком языке, как C++, в котором вызовы функций относительно

дешевы, этот метод к тому же и эффективен. Для каждого правила

вывода грамматики имеется функция, вызывающая другие функции.

Терминальные символы (например, END, NUMBER, + и -) распознаются

лексическим анализатором get_token(), а нетерминальные символы

распознаются функциями синтаксического анализа expr(), term() и

prim(). Как только оба операнда (под)выражения известны, оно

вычисляется; в настоящем компиляторе в этой точке производится

генерация кода.

Программа разбора для получения ввода использует функцию

get_token(). Значение последнего вызова get_token() находится в

переменной curr_tok; curr_tok имеет одно из значений перечисления

token_value:

enum token_value {

NAME NUMBER END

PLUS='+' MINUS='-' MUL='*' DIV='/'

PRINT=';' ASSIGN='=' LP='(' RP=')'

};

token_value curr_tok;

- стр 79 -

В каждой функции разбора предполагается, что было обращение к

get_token(), и в curr_tok находится очередной символ, подлежащий

анализу. Это позволяет программе разбора заглядывать на один

лексический символ (лексему) вперед и заставляет функцию разбора

всегда читать на одну лексему больше, чем используется правилом,

для обработки которого она была вызвана. Каждая функция разбора

вычисляет "свое" выражение и возвращает значение. Функция expr()

обрабатывает сложение и вычитание; она состоит из простого цикла,

который ищет термы для сложения или вычитания:

double expr() // складывает и вычитает

{

double left = term();

for(;;) // ``навсегда``

switch(curr_tok) {

case PLUS:

get_token(); // ест '+'

left += term();

break;

case MINUS:

get_token(); // ест '-'

left -= term();

break;

default:

return left;

}

}

Фактически сама функция делает не очень много. В манере, достаточно

типичной для функций более высокого уровня в больших программах,

она вызывает для выполнения работы другие функции. Заметьте, что

выражение 2-3+4 вычисляется как (2-3)+4, как указано грамматикой.

Странная запись for(;;) - это стандартный способ задать

бесконечный цикл; можно произносить это как "навсегда"*. Это

вырожденная форма оператора for; альтернатива - while(1).

Выполнение оператора switch повторяется до тех пор, пока не будет

найдено ни + ни -, и тогда выполняется оператор return в случае

default.

Операции += и -= используются для осуществления сложения и

вычитания. Можно было бы не изменяя смысла программы использовать

left=left+term() и left=left-term(). Однако left+=term() и left-

=term() не только короче, но к тому же явно выражают

подразумеваемое действие. Для бинарной операции @ выражение x@=y

означает x=x@y за исключением того, что x вычисляется только один

раз. Это применимо к бинарным операциям

+ - * / % & | ^ << >>

поэтому возможны следующие операции присваивания:

+= -= *= /= %= &= |= ^= <<= >>=

____________________

* игра слов: "for" - "forever" (навсегда). (прим. перев.)

- стр 80 -

Каждая является отдельной лексемой, поэтому a+ =1 является

синтаксической ошибкой из-за пробела между + и =. (% является

операцией взятия по модулю; &,| и ^ являются побитовми операциями

И, ИЛИ и исключающее ИЛИ; << и >> являются операциями левого и

правого сдвига). Функции term() и get_token() должны быть описаны

до expr().

Как организовать программу в виде набора файлов, обсуждается в

Главе 4. За одним исключением все описания в данной программе

настольного калькулятора можно упорядочить так, чтобы все

описывалось ровно один раз и до использования. Исключением является

expr(), которая обращается к term(), которая обращается к prim(),

которая в свою очередь обращается к expr(). Этот круг надо как-то

разорвать; описание

double expr(); // без этого нельзя

перед prim() прекрасно справляется с этим.

Функция term() аналогичным образом обрабатывает умножение и

сложение:

double term() // умножает и складывает

{

double left = prim();

for(;;)

switch(curr_tok) {

case MUL:

get_token(); // ест '*'

left *= prim();

break;

case DIV:

get_token(); // ест '/'

double d = prim();

if (d == 0) return error("деление на 0");

left /= d;

break;

default:

return left;

}

}

Проверка, которая делается, чтобы удостовериться в том, что нет

деления на ноль, необходима, поскольку результат деления на ноль

неопределен и как правило является роковым. Функция error(char*)

будет описана позже. Переменная d вводится в программе там, где она

нужна, и сразу же инициализируется. Во многих языках описание может

располагаться только в голове блока. Это ограничение может

приводить к довольно скверному искажению стиля программирования

и/или излишним ошибкам. Чаще всего неинициализированнные локальные

переменные являются просто признаком плохого стиля; исключением

являются переменные, подлежащие инициализации посредством ввода, и

переменные векторного или структурного типа, кторые нельзя удобно

- стр 81 -

инициализировать одними присваиваниями*. Заметьте, что = является

операцией присваивания, а == операцией сравнения.

Функция prim, обрабатывающая primary, написана в основном в том

же духе, не считая того, что немного реальной работы в ней все-таки

выполняется, и нет нужды в цикле, поскольку мы попадаем на более

низкий уровень иерархии вызовов:

double prim() // обрабатывает primary (первичные)

{

switch (curr_tok) {

case NUMBER: // константа с плавающей точкой

get_token();

return number_value;

case NAME:

if (get_token() == ASSIGN) {

name* n = insert(name_string);

get_token();

n->value = expr();

return n->value;

}

return look(name-string)->value;

case MINUS: // унарный минус

get_token();

return -prim();

case LP:

get_token();

double e = expr();

if (curr_tok != RP) return error("должна быть )");

get_token();

return e;

case END:

return 1;

default:

return error("должно быть primary");

}

}

При обнаружении NUMBER (то есть, константы с плавающей точкой),

возвращается его значение. Функция ввода get_token() помещает

значение в глобальную переменную number_value. Использование в

программе глобальных переменных часто указывает на то, что

структура не совсем прозрачна, что применялась некоторого рода

оптимизация. Здесь дело обстоит именно так. Теоретически

лексический символ обычно состоит из двух частей: значения,

определяющего вид лексемы (в данной программе token_value), и (если

необходимо) значения лексемы. У нас имеется только одна простая

переменная curr_tok, поэтому для хранения значения последнего

считанного NUMBER понадобилась глобальная переменная number_value.

Это работает только потому, что калькулятор при вычислениях

использует только одно число перед чтением со входа другого.

Так же, как значение последнего встреченного NUMBER хранится в

number_value, в name_string в виде символьной строки хранится

представление последнего прочитанного NAME. Перед тем, как что-либо

____________________

* В языке немного лучше этого с этими исключениями тоже надо бы

справляться. (прим. автора)

- стр 82 -

сделать с именем, калькулятор должен заглянуть вперед, чтобы

посмотреть, осуществляется ли присваивание ему, или оно просто

используется. В обоих случаях надо справиться в таблице имен. Сама

таблица описывается в #3.1.3; здесь надо знать только, что она

состоит из элементов вида:

srtuct name {

char* string;

char* next;

double value;

}

где next используется только функциями, которые поддерживают работу

с таблицей:

name* look(char*);

name* insert(char*);

Обе возвращают указатель на name, соответствующее параметру -

символьной строке; look() выражает недовольство, если имя не было

определено. Это значит, что в калькуляторе можно использовать имя

без предварительного описания, но первый раз оно должно

использоваться в левой части присваивания.

3.1.2 Функция ввода

Чтение ввода - часто самая запутанная часть программы. Причина в

том, что если программа должна общаться с человеком, то она должна

справляться с его причудами, условностями и внешне случайными

ошибками. Попытки заставить человека вести себя более удобным для

машины образом часто (и справедливо) рассматриваются как

оскорбительные. Задача низкоуровненовой программы ввода состоит в

том, чтобы читать символы по одному и составлять из них лексические

символы более высокого уровня. Далее эти лексемы служат вводом для

программ более высокого уровня. У нас ввод низкого уровня

осуществляется get_token(). Обнадеживает то, что написание программ

ввода низкого уровня не является ежедневной работой; в хорошей

системе для этого будут стандартные функции.

Для калькулятора правила ввода сознательно были выбраны такими,

чтобы функциям по работе с потоками было неудобно эти правила

обрабатывать; незначительные изменения в определении лексем сделали

бы get_token() обманчиво простой.

Первая сложность состоит в том, что символ новой строки '\n'

является для калькулятора существенным, а функции работы с потоками

считают его символом пропуска. То есть, для этих функций '\n'

значим только как ограничитель лексемы. Чтобы преодолеть это, надо

проверять пропуски (пробел, символы табуляции и т.п.):

char ch

do { // пропускает пропуски за исключением '\n'

if(!cin.get(ch)) return curr_tok = END;

} while (ch!='\n' && isspace(ch));

- стр 83 -

Вызов cin.get(ch) считывает один символ из стандартного потока

ввода в ch. Проверка if(!cin.get(ch)) не проходит в случае, если из

cin нельзя считать ниодного символа; в этом случае возвращается

END, чтобы завершить сеанс работы калькулятора. Используется

операция ! (НЕ), поскольку get() возвращает в случае успеха

ненулевое значение.

Функция (inline) isspace() из обеспечивает стандартную

проверку на то, является ли символ пропуском (#8.4.1); isspace(c)

возвращает ненулевое значение, если c является символом пропуска, и

ноль в противном случае. Проверка реализуется в виде поиска в

таблице, поэтому использование isspace() намного быстрее, чем

проверка на отдельные символы пропуска; это же относится и к

функциям isalpha(), isdigit() и isalnum(), которые используются в

get_token().

После того, как пустое место пропущено, следущий символ

используется для определения того, какого вида какого вида лексема

приходит. Давайте сначала рассмотрим некоторые случаи отдельно,

прежде чем приводить всю функцию. Ограничители лексем '\n' и ';'

обрабатываются так:

switch (ch) {

case ';':

case '\n':

cin >> WS; // пропустить пропуск

return curr_tok=PRINT;

Пропуск пустого места делать необязательно, но он позволяет

избежать повторных обращений к get_token(). WS - это стандартный

пропусковый объект, описанный в ; он используется только

для сброса пропуска. Ошибка во вводе или конец ввода не будут

обнаружены до следующего обращения к get_token(). Обратите внимание

на то, как можно использовать несколько меток case (случаев) для

одной и той же последовательности операторов, обрабатывающих эти

случаи. В обоих случаях возвращается лексема PRINT и помещается в

curr_tok.

Числа обрабатыватся так:

case '0': case '1': case '2': case '3': case '4':

case '5': case '6': case '7': case '8': case '9':

case '.':

cin.putback(ch);

cin >> number_value;

return curr_tok=NUMBER;

Располагать метки случаев case горизонтально, а не вертикально,

не очень хорошая мысль, поскольку читать это гораздо труднее, но

отводить по одной строке на каждую цифру нудно.

Поскольку операция >> определена также и для чтения констант с

плавающей точкой в double, программирование этого не составляет

труда: сперва начальный символ (цифра или точка) помещается обратно

в cin, а затем можно считывать константу в number_value.

Имя, то есть лексема NAME, определяется как буква, за которой

возможно следует несколько букв или цифр:

- стр 84 -

if (isalpha(ch)) {

char* p = name_string;

*p++ = ch;

while (cin.get(ch) && isalnum(ch)) *p++ = ch;

cin.putback(ch);

*p = 0;

return curr_tok=NAME;

}

Эта часть строит в name_string строку, заканчивающуюся нулем.

Функции isalpha() и isalnum() заданы в ; isalnum(c) не

ноль, если c буква или цифра, ноль в противном случае.

Вот, наконец, функция ввода полностью:

token_value get_token()

{

char ch;

do { // пропускает пропуски за исключением '\n'

if(!cin.get(ch)) return curr_tok = END;

} while (ch!='\n' && isspace(ch));

switch (ch) {

case ';':

case '\n':

cin >> WS; // пропустить пропуск

return curr_tok=PRINT;

case '*':

case '/':

case '+':

case '-':

case '(':

case ')':

case '=':

return curr_tok=ch;

case '0': case '1': case '2': case '3': case '4':

case '5': case '6': case '7': case '8': case '9':

case '.':

cin.putback(ch);

cin >> number_value;

return curr_tok=NUMBER;

default: // NAME, NAME= или ошибка

if (isalpha(ch)) {

char* p = name_string;

*p++ = ch;

while (cin.get(ch) && isalnum(ch)) *p++ = ch;

cin.putback(ch);

*p = 0;

return curr_tok=NAME;

}

error("плохая лексема");

return curr_tok=PRINT;

}

}

- стр 85 -

Поскольку token_value (значение лексемы) операции было

определено как целое значение этой операции*, обработка всех

операций тривиальна.

3.1.3 Таблица имен

К таблице имен доступ осуществляется с помощью одной функции

name* look(char* p, int ins =0);

Ее второй параметр указывает, нужно ли сначала поместить строку

символов в таблицу. Инициализатор =0 задает параметр, кторый

надлежит использовать по умолчанию, когда look() вызывается с одним

параметром. Это дает удобство записи, когда look("sqrt2") означает

look("sqrt2",0), то есть просмотр, без помещения в таблицу. Чтобы

получить такое же удобство записи для помещения в таблицу,

определяется вторая функция:

inline name* insert(char* s) { return look(s,1);}

Как уже отмечалось раньше, элементы этой таблицы имеют тип:

srtuct name {

char* string;

char* next;

double value;

}

Член next используется только для сцепления вместе имен в таблице.

Сама таблица - это просто вектор указателей на объекты типа name:

const TBLSZ = 23;

name* table[TBLSZ];

Поскольку все статические объекты инициализируются нулем, это

тривиальное описание таблицы table гарантирует также надлежащую

инициализацию.

Для нахождения элемента в таблице в look() принимается простой

алгоритм хэширования (имена с одним и тем же хэш-кодом зацепляются

вместе):

int ii = 0; // хэширование

char* pp = p;

while (*pp) ii = ii<<1 ^ *pp++;

if (ii < 0) ii = -ii;

ii %= TBLSZ;

То есть, с помощью исключающего ИЛИ каждый символ во входной строке

"добавляется" к ii ("сумме" предыдущих символов). Бит в x^y

устанавливается единичным тогда и только тогда, когда

соответствующие биты в x и y различны. Перед применением в символе

исключающего ИЛИ, ii сдвигается на один бит влево, чтобы не

____________________