]> ncurses.scripts.mit.edu Git - ncurses.git/blobdiff - ncurses/tinfo/comp_scan.c
ncurses 5.4
[ncurses.git] / ncurses / tinfo / comp_scan.c
index 56ba1d1a5a59e3b4b3dcb5ae54f5927e71e0d215..c819edcaaf3f5755e9e2b89cbe9320874e2cdbed 100644 (file)
@@ -1,5 +1,5 @@
 /****************************************************************************
- * Copyright (c) 1998,1999,2000 Free Software Foundation, Inc.              *
+ * Copyright (c) 1998-2002,2003 Free Software Foundation, Inc.              *
  *                                                                          *
  * Permission is hereby granted, free of charge, to any person obtaining a  *
  * copy of this software and associated documentation files (the            *
@@ -50,7 +50,7 @@
 #include <term_entry.h>
 #include <tic.h>
 
-MODULE_ID("$Id: comp_scan.c,v 1.45 2000/07/08 00:43:55 tom Exp $")
+MODULE_ID("$Id: comp_scan.c,v 1.66 2003/12/14 00:32:40 tom Exp $")
 
 /*
  * Maximum length of string capability we'll accept before raising an error.
@@ -60,14 +60,22 @@ MODULE_ID("$Id: comp_scan.c,v 1.45 2000/07/08 00:43:55 tom Exp $")
 
 #define iswhite(ch)    (ch == ' '  ||  ch == '\t')
 
-int _nc_syntax = 0;            /* termcap or terminfo? */
-long _nc_curr_file_pos = 0;    /* file offset of current line */
-long _nc_comment_start = 0;    /* start of comment range before name */
-long _nc_comment_end = 0;      /* end of comment range before name */
-long _nc_start_line = 0;       /* start line of current entry */
-
-struct token _nc_curr_token =
-{0, 0, 0};
+NCURSES_EXPORT_VAR(int)
+_nc_syntax = 0;                        /* termcap or terminfo? */
+NCURSES_EXPORT_VAR(long)
+_nc_curr_file_pos = 0;         /* file offset of current line */
+NCURSES_EXPORT_VAR(long)
+_nc_comment_start = 0;         /* start of comment range before name */
+NCURSES_EXPORT_VAR(long)
+_nc_comment_end = 0;           /* end of comment range before name */
+NCURSES_EXPORT_VAR(long)
+_nc_start_line = 0;            /* start line of current entry */
+
+NCURSES_EXPORT_VAR(struct token)
+_nc_curr_token =
+{
+    0, 0, 0
+};
 
 /*****************************************************************************
  *
@@ -76,18 +84,20 @@ struct token _nc_curr_token =
  *****************************************************************************/
 
 static bool first_column;      /* See 'next_char()' below */
+static bool had_newline;
 static char separator;         /* capability separator */
 static int pushtype;           /* type of pushback token */
-static char pushname[MAX_NAME_SIZE + 1];
+static char *pushname;
 
-#ifdef NCURSES_EXT_FUNCS
-bool _nc_disable_period = FALSE; /* used by tic -a option */
+#if NCURSES_EXT_FUNCS
+NCURSES_EXPORT_VAR(bool)
+_nc_disable_period = FALSE;    /* used by tic -a option */
 #endif
 
+static bool end_of_stream(void);
 static int last_char(void);
 static int next_char(void);
 static long stream_pos(void);
-static bool end_of_stream(void);
 static void push_back(char c);
 
 /* Assume we may be looking at a termcap-style continuation */
@@ -133,42 +143,54 @@ eat_escaped_newline(int ch)
  *
  */
 
-int
-_nc_get_token(void)
+NCURSES_EXPORT(int)
+_nc_get_token(bool silent)
 {
     static const char terminfo_punct[] = "@%&*!#";
-    long number;
-    int type;
-    int ch;
+    static char *buffer;
+
+    char *after_list;
+    char *after_name;
     char *numchk;
-    char numbuf[80];
-    unsigned found;
-    static char buffer[MAX_ENTRY_SIZE];
     char *ptr;
+    char *s;
+    char numbuf[80];
+    int ch;
     int dot_flag = FALSE;
+    int type;
+    long number;
     long token_start;
+    unsigned found;
 
     if (pushtype != NO_PUSHBACK) {
        int retval = pushtype;
 
-       _nc_set_type(pushname);
+       _nc_set_type(pushname != 0 ? pushname : "");
        DEBUG(3, ("pushed-back token: `%s', class %d",
-               _nc_curr_token.tk_name, pushtype));
+                 _nc_curr_token.tk_name, pushtype));
 
        pushtype = NO_PUSHBACK;
-       pushname[0] = '\0';
+       if (pushname != 0)
+           pushname[0] = '\0';
 
        /* currtok wasn't altered by _nc_push_token() */
        return (retval);
     }
 
-    if (end_of_stream())
+    if (end_of_stream()) {
+       if (buffer != 0) {
+           FreeAndNull(buffer);
+       }
        return (EOF);
+    }
 
   start_token:
     token_start = stream_pos();
-    while ((ch = next_char()) == '\n' || iswhite(ch))
+    while ((ch = next_char()) == '\n' || iswhite(ch)) {
+       if (ch == '\n')
+           had_newline = TRUE;
        continue;
+    }
 
     ch = eat_escaped_newline(ch);
 
@@ -180,10 +202,10 @@ _nc_get_token(void)
            ch = next_char();
 
        if (ch == '.'
-#ifdef NCURSES_EXT_FUNCS
-        && !_nc_disable_period
+#if NCURSES_EXT_FUNCS
+           && !_nc_disable_period
 #endif
-       ) {
+           ) {
            dot_flag = TRUE;
            DEBUG(8, ("dot-flag set"));
 
@@ -198,31 +220,39 @@ _nc_get_token(void)
 
        /* have to make some punctuation chars legal for terminfo */
        if (!isalnum(ch)
-#ifdef NCURSES_EXT_FUNCS
-        && !(ch == '.' && _nc_disable_period)
+#if NCURSES_EXT_FUNCS
+           && !(ch == '.' && _nc_disable_period)
 #endif
-        && !strchr(terminfo_punct, (char) ch)) {
-           _nc_warning("Illegal character (expected alphanumeric or %s) - %s",
-               terminfo_punct, unctrl(ch));
+           && !strchr(terminfo_punct, (char) ch)) {
+           if (!silent)
+               _nc_warning("Illegal character (expected alphanumeric or %s) - %s",
+                           terminfo_punct, unctrl((chtype) ch));
            _nc_panic_mode(separator);
            goto start_token;
        }
 
+       if (buffer == 0)
+           buffer = typeMalloc(char, MAX_ENTRY_SIZE);
+
        ptr = buffer;
        *(ptr++) = ch;
 
        if (first_column) {
-           char *desc;
-
            _nc_comment_start = token_start;
            _nc_comment_end = _nc_curr_file_pos;
            _nc_start_line = _nc_curr_line;
 
            _nc_syntax = ERR;
+           after_name = 0;
+           after_list = 0;
            while ((ch = next_char()) != '\n') {
-               if (ch == EOF)
-                   _nc_err_abort("premature EOF");
-               else if (ch == ':' && last_char() != ',') {
+               if (ch == EOF) {
+                   _nc_err_abort(MSG_NO_MEMORY);
+               } else if (ch == '|') {
+                   after_list = ptr;
+                   if (after_name == 0)
+                       after_name = ptr;
+               } else if (ch == ':' && last_char() != ',') {
                    _nc_syntax = SYN_TERMCAP;
                    separator = ':';
                    break;
@@ -230,16 +260,18 @@ _nc_get_token(void)
                    _nc_syntax = SYN_TERMINFO;
                    separator = ',';
                    /*
-                    * Fall-through here is not an accident.
-                    * The idea is that if we see a comma, we
-                    * figure this is terminfo unless we
-                    * subsequently run into a colon -- but
-                    * we don't stop looking for that colon until
-                    * hitting a newline.  This allows commas to
-                    * be embedded in description fields of
+                    * If we did not see a '|', then we found a name with no
+                    * aliases or description.
+                    */
+                   if (after_name == 0)
+                       break;
+                   /*
+                    * If we see a comma, we assume this is terminfo unless we
+                    * subsequently run into a colon.  But we don't stop
+                    * looking for a colon until hitting a newline.  This
+                    * allows commas to be embedded in description fields of
                     * either syntax.
                     */
-                   /* FALLTHRU */
                } else
                    ch = eat_escaped_newline(ch);
 
@@ -248,11 +280,10 @@ _nc_get_token(void)
            ptr[0] = '\0';
            if (_nc_syntax == ERR) {
                /*
-                * Grrr...what we ought to do here is barf,
-                * complaining that the entry is malformed.
-                * But because a couple of name fields in the
-                * 8.2 termcap file end with |\, we just have
-                * to assume it's termcap syntax.
+                * Grrr...what we ought to do here is barf, complaining that
+                * the entry is malformed.  But because a couple of name fields
+                * in the 8.2 termcap file end with |\, we just have to assume
+                * it's termcap syntax.
                 */
                _nc_syntax = SYN_TERMCAP;
                separator = ':';
@@ -264,55 +295,61 @@ _nc_get_token(void)
            }
 
            /*
-            * This is the soonest we have the terminal name
-            * fetched.  Set up for following warning messages.
+            * This is the soonest we have the terminal name fetched.  Set up
+            * for following warning messages.  If there's no '|', then there
+            * is no description.
             */
-           ptr = strchr(buffer, '|');
-           if (ptr == (char *) NULL)
-               ptr = buffer + strlen(buffer);
-           ch = *ptr;
-           *ptr = '\0';
-           _nc_set_type(buffer);
-           *ptr = ch;
+           if (after_name != 0) {
+               ch = *after_name;
+               *after_name = '\0';
+               _nc_set_type(buffer);
+               *after_name = ch;
+           }
 
            /*
-            * Compute the boundary between the aliases and the
-            * description field for syntax-checking purposes.
+            * Compute the boundary between the aliases and the description
+            * field for syntax-checking purposes.
             */
-           desc = strrchr(buffer, '|');
-           if (desc) {
-               if (*desc == '\0')
-                   _nc_warning("empty longname field");
-               else if (strchr(desc, ' ') == (char *) NULL)
-                   _nc_warning("older tic versions may treat the description field as an alias");
+           if (after_list != 0) {
+               if (!silent) {
+                   if (*after_list == '\0')
+                       _nc_warning("empty longname field");
+                   else if (strchr(after_list, ' ') == 0)
+                       _nc_warning("older tic versions may treat the description field as an alias");
+               }
+           } else {
+               after_list = buffer + strlen(buffer);
+               DEBUG(1, ("missing description"));
            }
-           if (!desc)
-               desc = buffer + strlen(buffer);
 
            /*
-            * Whitespace in a name field other than the long name
-            * can confuse rdist and some termcap tools.  Slashes
-            * are a no-no.  Other special characters can be
-            * dangerous due to shell expansion.
+            * Whitespace in a name field other than the long name can confuse
+            * rdist and some termcap tools.  Slashes are a no-no.  Other
+            * special characters can be dangerous due to shell expansion.
             */
-           for (ptr = buffer; ptr < desc; ptr++) {
-               if (isspace(*ptr)) {
-                   _nc_warning("whitespace in name or alias field");
+           for (s = buffer; s < after_list; ++s) {
+               if (isspace(UChar(*s))) {
+                   if (!silent)
+                       _nc_warning("whitespace in name or alias field");
                    break;
-               } else if (*ptr == '/') {
-                   _nc_warning("slashes aren't allowed in names or aliases");
+               } else if (*s == '/') {
+                   if (!silent)
+                       _nc_warning("slashes aren't allowed in names or aliases");
                    break;
-               } else if (strchr("$[]!*?", *ptr)) {
-                   _nc_warning("dubious character `%c' in name or alias field", *ptr);
+               } else if (strchr("$[]!*?", *s)) {
+                   if (!silent)
+                       _nc_warning("dubious character `%c' in name or alias field", *s);
                    break;
                }
            }
 
-           ptr = buffer;
-
            _nc_curr_token.tk_name = buffer;
            type = NAMES;
        } else {
+           if (had_newline && _nc_syntax == SYN_TERMCAP) {
+               _nc_warning("Missing backslash before newline");
+               had_newline = FALSE;
+           }
            while ((ch = next_char()) != EOF) {
                if (!isalnum(ch)) {
                    if (_nc_syntax == SYN_TERMINFO) {
@@ -336,9 +373,9 @@ _nc_get_token(void)
                type = BOOLEAN;
                break;
            case '@':
-               if ((ch = next_char()) != separator)
+               if ((ch = next_char()) != separator && !silent)
                    _nc_warning("Missing separator after `%s', have %s",
-                       buffer, unctrl(ch));
+                               buffer, unctrl((chtype) ch));
                _nc_curr_token.tk_name = buffer;
                type = CANCEL;
                break;
@@ -352,18 +389,20 @@ _nc_get_token(void)
                }
                numbuf[found] = '\0';
                number = strtol(numbuf, &numchk, 0);
-               if (numchk == numbuf)
-                   _nc_warning("no value given for `%s'", buffer);
-               if ((*numchk != '\0') || (ch != separator))
-                   _nc_warning("Missing separator");
+               if (!silent) {
+                   if (numchk == numbuf)
+                       _nc_warning("no value given for `%s'", buffer);
+                   if ((*numchk != '\0') || (ch != separator))
+                       _nc_warning("Missing separator");
+               }
                _nc_curr_token.tk_name = buffer;
                _nc_curr_token.tk_valnumber = number;
                type = NUMBER;
                break;
 
            case '=':
-               ch = _nc_trans_string(ptr, buffer + sizeof(buffer));
-               if (ch != separator)
+               ch = _nc_trans_string(ptr, buffer + MAX_ENTRY_SIZE);
+               if (!silent && ch != separator)
                    _nc_warning("Missing separator");
                _nc_curr_token.tk_name = buffer;
                _nc_curr_token.tk_valstring = ptr;
@@ -376,7 +415,8 @@ _nc_get_token(void)
            default:
                /* just to get rid of the compiler warning */
                type = UNDEF;
-               _nc_warning("Illegal character - %s", unctrl(ch));
+               if (!silent)
+                   _nc_warning("Illegal character - %s", unctrl((chtype) ch));
            }
        }                       /* end else (first_column == FALSE) */
     }                          /* end else (ch != EOF) */
@@ -391,30 +431,30 @@ _nc_get_token(void)
        switch (type) {
        case BOOLEAN:
            _tracef("Token: Boolean; name='%s'",
-               _nc_curr_token.tk_name);
+                   _nc_curr_token.tk_name);
            break;
 
        case NUMBER:
            _tracef("Token: Number;  name='%s', value=%d",
-               _nc_curr_token.tk_name,
-               _nc_curr_token.tk_valnumber);
+                   _nc_curr_token.tk_name,
+                   _nc_curr_token.tk_valnumber);
            break;
 
        case STRING:
            _tracef("Token: String;  name='%s', value=%s",
-               _nc_curr_token.tk_name,
-               _nc_visbuf(_nc_curr_token.tk_valstring));
+                   _nc_curr_token.tk_name,
+                   _nc_visbuf(_nc_curr_token.tk_valstring));
            break;
 
        case CANCEL:
            _tracef("Token: Cancel; name='%s'",
-               _nc_curr_token.tk_name);
+                   _nc_curr_token.tk_name);
            break;
 
        case NAMES:
 
            _tracef("Token: Names; value='%s'",
-               _nc_curr_token.tk_name);
+                   _nc_curr_token.tk_name);
            break;
 
        case EOF:
@@ -428,9 +468,12 @@ _nc_get_token(void)
 #endif
 
     if (dot_flag == TRUE)      /* if commented out, use the next one */
-       type = _nc_get_token();
+       type = _nc_get_token(silent);
 
-    DEBUG(3, ("token: `%s', class %d", _nc_curr_token.tk_name, type));
+    DEBUG(3, ("token: `%s', class %d",
+             _nc_curr_token.tk_name != 0 ? _nc_curr_token.tk_name :
+             "<null>",
+             type));
 
     return (type);
 }
@@ -454,11 +497,11 @@ _nc_get_token(void)
  *
  */
 
-char
+NCURSES_EXPORT(char)
 _nc_trans_string(char *ptr, char *last)
 {
     int count = 0;
-    int number;
+    int number = 0;
     int i, c;
     chtype ch, last_ch = '\0';
     bool ignored = FALSE;
@@ -472,7 +515,7 @@ _nc_trans_string(char *ptr, char *last)
        if (ch == '^' && last_ch != '%') {
            ch = c = next_char();
            if (c == EOF)
-               _nc_err_abort("Premature EOF");
+               _nc_err_abort(MSG_NO_INPUTS);
 
            if (!(is7bits(ch) && isprint(ch))) {
                _nc_warning("Illegal ^ character - %s", unctrl(ch));
@@ -489,14 +532,14 @@ _nc_trans_string(char *ptr, char *last)
        } else if (ch == '\\') {
            ch = c = next_char();
            if (c == EOF)
-               _nc_err_abort("Premature EOF");
+               _nc_err_abort(MSG_NO_INPUTS);
 
            if (ch >= '0' && ch <= '7') {
                number = ch - '0';
                for (i = 0; i < 2; i++) {
                    ch = c = next_char();
                    if (c == EOF)
-                       _nc_err_abort("Premature EOF");
+                       _nc_err_abort(MSG_NO_INPUTS);
 
                    if (c < '0' || c > '7') {
                        if (isdigit(c)) {
@@ -571,7 +614,9 @@ _nc_trans_string(char *ptr, char *last)
 
                default:
                    _nc_warning("Illegal character %s in \\ sequence",
-                       unctrl(ch));
+                               unctrl(ch));
+                   /* FALLTHRU */
+               case '|':
                    *(ptr++) = (char) ch;
                }               /* endswitch (ch) */
            }                   /* endelse (ch < '0' ||  ch > '7') */
@@ -608,26 +653,28 @@ _nc_trans_string(char *ptr, char *last)
  *     get_token() call.
  */
 
-void
+NCURSES_EXPORT(void)
 _nc_push_token(int tokclass)
 {
     /*
-     * This implementation is kind of bogus, it will fail if we ever do
-     * more than one pushback at a time between get_token() calls.  It
-     * relies on the fact that curr_tok is static storage that nothing
-     * but get_token() touches.
+     * This implementation is kind of bogus, it will fail if we ever do more
+     * than one pushback at a time between get_token() calls.  It relies on the
+     * fact that _nc_curr_token is static storage that nothing but
+     * _nc_get_token() touches.
      */
     pushtype = tokclass;
+    if (pushname == 0)
+       pushname = typeMalloc(char, MAX_NAME_SIZE + 1);
     _nc_get_type(pushname);
 
     DEBUG(3, ("pushing token: `%s', class %d",
-           _nc_curr_token.tk_name, pushtype));
+             _nc_curr_token.tk_name, pushtype));
 }
 
 /*
  * Panic mode error recovery - skip everything until a "ch" is found.
  */
-void
+NCURSES_EXPORT(void)
 _nc_panic_mode(char ch)
 {
     int c;
@@ -661,11 +708,12 @@ static FILE *yyin;                /* scanner's input file descriptor */
  *     non-null.
  */
 
-void
-_nc_reset_input(FILE * fp, char *buf)
+NCURSES_EXPORT(void)
+_nc_reset_input(FILE *fp, char *buf)
 {
     pushtype = NO_PUSHBACK;
-    pushname[0] = '\0';
+    if (pushname != 0)
+       pushname[0] = '\0';
     yyin = fp;
     bufstart = bufptr = buf;
     _nc_curr_file_pos = 0L;
@@ -684,7 +732,7 @@ last_char(void)
 {
     size_t len = strlen(bufptr);
     while (len--) {
-       if (!isspace(bufptr[len]))
+       if (!isspace(UChar(bufptr[len])))
            return bufptr[len];
     }
     return 0;
@@ -708,6 +756,10 @@ static int
 next_char(void)
 {
     if (!yyin) {
+       /*
+        * An string with an embedded null will truncate the input.  This is
+        * intentional (we don't read binary files here).
+        */
        if (*bufptr == '\0')
            return (EOF);
        if (*bufptr == '\n') {
@@ -716,46 +768,66 @@ next_char(void)
        }
     } else if (!bufptr || !*bufptr) {
        /*
-        * In theory this could be recoded to do its I/O one
-        * character at a time, saving the buffer space.  In
-        * practice, this turns out to be quite hard to get
-        * completely right.  Try it and see.  If you succeed,
-        * don't forget to hack push_back() correspondingly.
+        * In theory this could be recoded to do its I/O one character at a
+        * time, saving the buffer space.  In practice, this turns out to be
+        * quite hard to get completely right.  Try it and see.  If you
+        * succeed, don't forget to hack push_back() correspondingly.
         */
-       static char line[LEXBUFSIZ];
+       static char *result;
+       static size_t allocated;
+       size_t used;
        size_t len;
 
        do {
-           _nc_curr_file_pos = ftell(yyin);
-
-           if ((bufstart = fgets(line, LEXBUFSIZ, yyin)) != NULL) {
-               _nc_curr_line++;
-               _nc_curr_col = 0;
-           }
-           bufptr = bufstart;
-       } while
-           (bufstart != NULL && line[0] == '#');
-
-       if (bufstart == NULL)
-           return (EOF);
-
-       while (iswhite(*bufptr))
-           bufptr++;
+           bufstart = 0;
+           used = 0;
+           do {
+               if (used + (LEXBUFSIZ / 4) >= allocated) {
+                   allocated += (allocated + LEXBUFSIZ);
+                   result = typeRealloc(char, allocated, result);
+                   if (result == 0)
+                       return (EOF);
+               }
+               if (used == 0)
+                   _nc_curr_file_pos = ftell(yyin);
+
+               if (fgets(result + used, allocated - used, yyin) != 0) {
+                   bufstart = result;
+                   if (used == 0) {
+                       _nc_curr_line++;
+                       _nc_curr_col = 0;
+                   }
+               } else {
+                   if (used != 0)
+                       strcat(result, "\n");
+               }
+               if ((bufptr = bufstart) != 0) {
+                   used = strlen(bufptr);
+                   while (iswhite(*bufptr))
+                       bufptr++;
 
-       /*
-        * Treat a trailing <cr><lf> the same as a <newline> so we can read
-        * files on OS/2, etc.
-        */
-       if ((len = strlen(bufptr)) > 1) {
-           if (bufptr[len - 1] == '\n'
-               && bufptr[len - 2] == '\r') {
-               bufptr[len - 2] = '\n';
-               bufptr[len - 1] = '\0';
-           }
-       }
+                   /*
+                    * Treat a trailing <cr><lf> the same as a <newline> so we
+                    * can read files on OS/2, etc.
+                    */
+                   if ((len = strlen(bufptr)) > 1) {
+                       if (bufptr[len - 1] == '\n'
+                           && bufptr[len - 2] == '\r') {
+                           len--;
+                           bufptr[len - 1] = '\n';
+                           bufptr[len] = '\0';
+                       }
+                   }
+               } else {
+                   return (EOF);
+               }
+           } while (bufptr[len - 1] != '\n');  /* complete a line */
+       } while (result[0] == '#');     /* ignore comments */
     }
 
     first_column = (bufptr == bufstart);
+    if (first_column)
+       had_newline = FALSE;
 
     _nc_curr_col++;
     return (*bufptr++);
@@ -782,7 +854,5 @@ end_of_stream(void)
 /* are we at end of input? */
 {
     return ((yyin ? feof(yyin) : (bufptr && *bufptr == '\0'))
-       ? TRUE : FALSE);
+           ? TRUE : FALSE);
 }
-
-/* comp_scan.c ends here */