Символы и строки
Компьютер
может обрабатывать не только числовую информацию, но и символьную.
Язык Delphi оперирует с символьной информацией, которая может быть
представлена как отдельными символами, так и строками
(по-cледовательностью символов).
Для
хранения и обработки символов используются переменные типа Ansichar и
wideChar. Тип Ansichar представляет собой набор ANSI-символов, з
котором каждый символ кодируется восьмиразрядным двоичным числом
(байтом). Тип wideChar представляет собой набор символов в кодировке
Unicode, в которой каждый символ кодируется двумя байтами.
Для обеспечения совместимости с предыдущими версиями поддерживается тип Char, эквивалентный AnsiChar.
Значением переменной символьного типа может быть любой отображаемый символ:
- буква русского или латинского алфавитов;
- цифра;
- знак препинания;
И специальный символ, например, "новая строка".
Переменная
символьного типа должна быть объявлена в разделе объявления
переменных. Инструкция объявления символьной переменной в общем виде
выглядит так:
Имя: char;
где:
- имя — имя переменной символьного типа;
- char — ключевое слово обозначения символьного типа.
Примеры:
otv: char; ch: char;
Как
и любая переменная программы, переменная типа char может получить
значение в результате выполнения инструкции присваивания. Если
переменная типа char получает значение в результате выполнения операции
присваивания, то справа от знака := должно стоять выражение типа char,
например, переменная типа char или символьная константа — символ,
заключенный в кавычки.
В результате выполнения инструкций c1 := '*';
с2 := c1;
переменная
c1 получает значение присваиванием значения константы, а переменная с2
— присваиванием значения переменной cl (предполагается, что переменные
c1 и с2 являются переменными символьного типа).
Переменную
типа char можно сравнить с другой переменной типа char или с
символьной константой. Сравнение основано на том, что каждому символу
поставлено в соответствие число (см. приложение 2), причем
символу 'о' соответствует число меньшее, чем символу У, символу 'А' —
меньшее, чем 'в', символу V — меньшее, чем а. Таким образом, можно
записать:
'0'<'1'<..<'9'<..<'A'<'B'<..<'Z'<'a'<'b'<..<'z'
Символам русского алфавита соответствуют числа большие, чем символам латинского алфавита, при этом справедливо следующее:
'А'<'Б'<'В'<..<'Ю'<'Я'<'а'<'б'<'в'<...<'э'<'ю'<'я'
В
тексте программы вместо символа можно указать его код, поставив перед
числом оператор #. Например, вместо константы 'в' можно записать #193.
Такой способ записи, как правило, используют для записи служебных
символов или символов, которые во время набора программы нельзя ввести с
клавиатуры. К примеру, часто используемый при записи сообщений символ
"новая строка" записывается так: #13.
В
программах обработки символьной информации часто используют функции
chr и Ord. Значением функции chr является символ, код которого указан в
качестве параметра. Например, в результате выполнения инструкции
c:=chr(32) переменной с будет присвоено значение пробел. Функция ord
позволяет определить код символа, который передается ей в качестве
параметра. Например, в результате выполнения инструкции k:=ord('*')
переменная k будет содержать число 42 — код символа *.
Листинг. Таблица символов
unit tablsim_;
interface
uses
Windows, Messages, SysUtils, Classes, Graphics,
Controls, Forms, Dialogs, StdCtrls;
type
TForm1 = class(TForm)
Label1: TLabe1;
procedure FormActivate(Sender: TObject); private
{ Private declarations }
public
{ Public declarations }
end;
var
Form1: TForm1;
implementation
{$R *.DFM}
procedure TForm1.FormActivate(Sender: TObject);
var
st:string; // таблица формируется как строка символов
dec: byte; // код символа
i,j:integer; // номер строки и колонки таблицы
begin
st:='';
dec:=192;
for i:=0 to 15 do // шестнадцать строк
begin
dec:=i + 192;
for j:=1 to 4 do // четыре колонки
begin
st:=st+chr(dec)+'-'+IntToStr(dec)+' '; dec:=dec + 16;
end;
st:=st + #13; // переход к новой строке экрана
end;
Label1.caption:=st;
end;
end.
Форма приложения Таблица символов содержит
только один компонент -поле метки (Label1l). Для того чтобы колонки
таблицы имели одинаковую ширину, свойству Label1.Font.Name следует
присвоить имя шрифта, у которого все символы имеют одинаковую ширину,
например, courier New cyr.
Строки
могут быть представлены следующими типами: shortstring, Longstring и
widestring. Различаются эти типы предельно допустимой длиной строки,
способом выделения памяти для переменных и методом кодировки символов.
Переменной
типа shortstring память выделяется статически, т. е. до начала
выполнения программы, и количество символов такой строки не может
превышать 255. Переменным типа Longstring и widestring память
выделяется динамически — во время работы программы, поэтому длина таких
строк практически не ограничена.
Помимо перечисленных выше типов можно применять универсальный cтроковый тип String. Тип String эквивалентен типу Shortstring.
Переменная
строкового типа должна быть объявлена в разделе объявления переменных.
Инструкция объявления в общем виде выглядит так:
Имя: String;
или
Имя: String [длина]
где:
- имя — имя переменной;
- string — ключевое слово обозначения строкового типа;
- длина — константа целого типа, которая задает максимально допустимую длину строки.
Пример объявления переменных строкового типа:
name: string[30];
buff: string;
Если в объявлении строковой переменной длина строки не указана, то ее длина задается равной 255 символам, т. е. объявления
stroka: string [255]; stroka: string;
эквивалентны.
В
тексте программы последовательность символов, являющаяся строкой
(строковой константой), заключается в одинарные кавычки. Например,
чтобы присвоить строковой переменной parol значение, нужно записать:
parol:= 'Большой секрет';
или
parol:= '2001';
Следует
обратить внимание, что инструкция parol:=2001; неверная, т.к. тип
константы не соответствует типу переменной. Во время компиляции этой
инструкции будет выведено сообщение: incompatible types: 'Char' and
'Integer' (типы Char и Integer несовместимы).
Используя
операции =, , = и о, переменную типа string можно сравнить с другой
переменной типа string или со строковой константой. Строки сравниваются
посимвольно, начиная с первого символа. Если все символы сравниваемых
строк одинаковые, то такие строки считаются равными. Если в одинаковых
позициях строк находятся разные символы, большей считается та строка, у
которой в этой позиции находится символ с большим кодом. В табл. 3.1
приведены примеры сравнения строк.
Таблица 3.1. Сравнение строк
Строка 1 |
Строка 2 |
Результат сравнения |
||
Иванов |
Иванов |
Строки равны |
||
Васильев |
Васильев |
Строка 1 больше строки 2 |
||
Алексеев |
Петров |
Строка 1 меньше строки 2 |
||
Иванова |
Иванов |
Строка 1 больше строки 2 |
||
Кроме
операции сравнения, к строковым переменным и константам можно
применить операцию сложения, в результате выполнения которой получается
новая строка. Например, в результате выполнения инструкций
f irst__name: ='Иван' ;
last_name:='Иванов';
ful_name:=first_name+last_name;
переменная fui_name получит значение 'Иван Иванов'.
В
языке Delphi есть несколько полезных при работе со строками функций и
процедур. Ниже приведено их краткое описание и примеры использования.
Функция
length возвращает длину строки. У этой функции один параметр —
выражение строкового типа. Значением функции length (целое число)
является количество символов, из которых состоит строка.
Например, в результате выполнения инструкций
n:=length('Иванов');
m:=length(' Невский проспект ');
значение переменных n и m будет равно 6 и 20.
Процедура delete позволяет удалить часть строки. В общем виде обращение к этой процедуре выглядит так:
delete(Строка, р, п)
где:
- Строка — переменная или константа строкового типа;
- р — номер символа, с которого начинается удаляемая подстрока;
- п — длина удаляемой подстроки.
Например, в результате выполнения инструкций
p:='Город Санкт-Петербург';
delete(s,7,6);
значением переменной s будет строка ' город Петербург'.
Функция роз позволяет определить положение подстроки в строке. В общем виде обращение к функции выглядит так:
pos(Подстрока,Строка) ;
где Подстрока — строковая константа или переменная, которую надо найти в строковой константе или переменной строка.
Например, в результате выполнения инструкции
р := pos('Пе','Санкт-Петербург');
значение переменной р будет равно 7. Если в строке нет искомой подстроки, то значение функции роз будет равно нулю.
Ниже приведена инструкция while, в результате выполнения которой удаляются начальные пробелы из строки st.
while(pos(' ',st) = 1) and(length(st) > 0) do delete (st,1,1);
Пробелы
удаляет инструкция delete (st, i, i), которая выполняется в цикле до
тех пор, пока первым символом строки является пробел (в этом случае значение
роs (' ',st) равно единице). Необходимость проверки условия length
(st) > 0 объясняется возможностью того, что введенная строка состоит
только из пробелов.
Функция сору позволяет выделить фрагмент строки. В общем виде обращение к функции сору выглядит так:
сору(Строка, р, п) где:
строка — выражение строкового типа, содержащее строку, фрагмент которой надо получить;
- р — номер первого символа, с которого начинается выделяемая подстрока;
- n — длина выделяемой подстроки. Например, в результате выполнения инструкций
st:= 'Инженер Иванов'; fam:=copy(st, 9, 6) ;
значением переменной fam будет строка 'Иванов1.