Documento e Informação


Fonte: TI Inside Online, Da Redação, 2010-04-19.

A maioria dos departamentos de TI ainda está começando a desenvolver estratégias para lidar com o enorme volume de dados trafegados. Estudo encomendado à Unisphere Research pela Informatica Corporation revela que 35% dos entrevistados ainda não sabem como gerenciar os volumes crescentes de dados corporativos. A empresa entrevistou mais de 225 membros do Grupo de Usuários de Aplicações Oracle (OAUG, na sigla em inglês).

De acordo com o levantamento, a maior parte das companhias busca resolver questões de desempenho com soluções de eficácia limitada, como ajustes no conjunto de aplicações, o que gera retornos menores, ou atualização ou expansão do parque de hardware, agregando complexidade e custos.

O levantamento constatou que 87% dos entrevistados responsabilizam o crescimento dos dados por seus problemas de desempenho. Além disso, verificou que os custos com manutenção são desproporcionais à utilidade da aplicação, sendo que 42% dos entrevistados disseram precisar de um a cinco funcionários em tempo integral para manter uma aplicação antiga. Um em cada sete entrevistados ressaltou que há necessidade de um efetivo ainda maior para manter aplicações antigas, enquanto que 14% disseram que alocam um décimo do orçamento anual de TI para manter essas aplicações.

O estudo revelou ainda que mais empresas precisam garantir que os dados não contenham identificadores que exponham informações confidenciais sobre clientes e parceiros. Setenta e cinco porcento das empresas questionadas disseram que fazem até cinco cópias dos dados em produção para fins de não-produção e 78%, que usam dados reais em produção em ambientes de não-produção.

Segundo a pesquisa, o problema do aumento dos dados é agravado por regras e políticas que exigem que tais informações permaneçam acessíveis por longos períodos. Pelo levantamento, 60% mantêm os dados por sete anos ou mais, 16% mantêm inalterados e 66% dizem que os dados arquivados precisam ter disponibilidade imediata de acordo com a necessidade.

O estudo conclui que o arquivamento de bancos de dados continuará a ser um desafio interno e exigirá ferramentas e abordagens apropriadas para lidar com o crescente volume de informações.

A Informatica, que encomendou o estudo, é o maior fornecedor independente de software para integração de dados e gerenciamento de ciclo de vida de informações (ILM).

Para saber mais:

Atualizações para os usuários Windows amantes das belas fontes do processador de documentos TeX, criado pelo célebre professor Donald Knuth no final da década de 70 mais ainda popular no meio técnico-científico acadêmico.

Revisei novamente meu artigo Fontes para os amantes do TeX, contemplando as versões atualizadas Computer Moder Unicode (CMU) 0.7.0, de junho 2009, e Latin Modern (LM) 2.004, de outubro 2009.

Incluí também imagens de amostra das duas famílias de fontes no artigo, para quem quiser conferir a aparência delas.

Um pouco de história

Creio que nada foi tão importante para a cultura, o avanço do conhecimento humano e a preservação da história da humanidade quanto a evolução da escrita. Das pedras da pré-história, ao papiro (Egito, terceiro milênio A.C.) e ao pergaminho, e daí chegando ao papel (China, século II).

Veio então a mecanização com a imprensa de Gutenberg (século XV) como veículo de massa, seguida da máquina de escrever (século XVIII) que tornou essa mecanização pessoal. No final dos anos 1940 a fotocópia (xerografia) popularizou a cópia fiel de documentos e o fax (facsimile) introduziu até a transferência remota de documentos através da rede telefônica.

E finalmente chegou a era dos computadores no século XX. No início, acreditava-se que o consumo de papel diminuiria bastante, pois ele teria ficado obsoleto. No entanto, na prática tem ocorrido o inverso: a cada ano, o consumo de papel tem sido maior. A máquina de escrever foi substituída pela dupla computador e impressora, e isso só aumentou a escala de uso do papel.

Junto com a era digital evoluiu toda a multimídia, inclusive áudio e vídeo. As fotos e imagens já se popularizaram fortemente no meio digital, e o filme de fotografia já está obsoleto. Mas o livro eletrônico e o papel digital ainda não são realidade para as massas.

A cultura do papel

Em tempos de sustentabilidade ecológica e social e da tecnologia como instrumento de aceleração do progresso, há forte motivação para redução do papel: A preservação das árvores (fonte da matéria prima celulose); a desburocratização e o imenso acúmulo de papel em instituições privadas e governamentais; a velocidade e a praticidade do meio digital como forma de armazenamento, recuperação e transmissão de informação.

No Brasil, já temos imposto de renda eletrônico via internet, o voto eletrônico, a nota fiscal eletrônica, o processo judicial eletrônico, o e-CPF e o e-CNPJ. Convenhamos, as iniciativas rumo à sociedade digital são muitas.

Mas cultura e os hábitos do papel, ampla e profundamente entranhados na humanidade há milhares de anos, não mudam fácil.

O correio eletrônico é a carta digital, mas ainda hoje muita gente imprime uma mensagem de e-mail ou outro texto digital apenas para ler, pois “é mais cômodo ler no papel do que na tela do computador”.

A tecnologia da assinatura digital, que permite dar validade oficial, legal e/ou jurídica a documentos eletrônicos já existe e está bem estabelecida desde o final da década de 70, mas ainda é tão desconhecida quanto cabeça de bacalhau para a grande maioria das pessoas. E mesmo a maioria dos que conhecem e usam ainda desconfiam.

Caminho tortuoso

Nas ferramentas digitais, há o scanner para digitalização. Em tese, o scanner é uma forma fácil de tornar digital qualquer legado existente em papel. Na prática, estabelecer um processo de trabalho e uma cultura adequados à lida com documentos digitais tem muito mais peso. O scanner pode se tornar um elemento a mais no emaranhado de ferramentas e recursos que, não raro, acabam por confundir as pessoas e/ou complicar o cenário de lidar com informação e documentos digitais.

Hoje, a maior parte dos documentos é confeccionado digitalmente em um editor de texto, no computador. Mas pode seguir caminhos estranhamente tortuosos a partir daí, como ser impresso, assinado no papel, transmitido por fax (e impresso de novo no destino), fotocopiado e, até, eventualmente, digitalizado para voltar ao computador, quem sabe daí ser transmitido por e-mail como uma imagem ou um arquivo PDF. Chega-se até ao luxo de recorrer ao OCR, a tecnologia de reconhecimento ótico de caracteres em documentos digitalizados como imagem, para converter em… texto como nasceu na origem, naquele editor de texto onde foi confeccionado, lembra?

Pesquisa recente da AIIM, associação internacional independente que promove o gerenciamento de documentos e de conteúdo, perto de 51% dos documentos em papel escaneados pelas organizações nascem digitais, tendo sido impressos diretamente de uma aplicação em computador. O estudo também apontou que 25% dos documentos digitalizados foram fotocopiados antes de ser enviados ao scanner, e que só 31% do total foram destruídos após digitalizados.

Além de comprovar que a situação tortuosa que descrevi, apesar de parecer ridícula, está bem perto do real, a pesquisa retrata objetivamente a relutância e dificuldade das organizações em lidar com o documento digital e em perder de vista (fisicamente falando) os seus documentos importantes.

Há ainda questões controversas sobre o documento digitalizado — a partir de original em papel — não ser legalmente presumido autêntico, tal que o papel possa ser eliminado. A Lei Federal nº 11.419/2006, que instituiu o processo judicial eletrônico no Brasil, teve que definir condições específicas em que os documentos produzidos eletronicamente serão considerados originais para todos os efeitos legais (Art. 11 e seus parágrafos), prevendo inclusive a destruição de citação, intimação ou notificação praticada em papel e digitalizada (Art. 9º § 2º).

Preservação e futuro

E como preservar o documento digital? O papel (e seus antecessores) tem permitido preservar o conhecimento e a história da humanidade por milhares de anos. Mas em um mundo da tecnologia em constante ebulição, ainda é um desafio para especialistas, governos e organizações garantir padrões, condições e recursos para a preservação e efetividade do conteúdo digital por centenas e milhares de anos.

Nesse cenário, meu sonho de consumo, como adepto fervoroso da tecnologia, é ver toda essa tecnologia, cultura e hábitos do conteúdo digital estabilizada, disseminada e aceita na cabeça e no dia-a-dia de todos, de forma simples, efetiva, duradoura e natural.

Finalmente! Esperava pela atualização das análises do mercado de ECM pelos principais institutos, desde a aquisição da Vignette pela Open Text, e foram publicados o Quadrante Mágico do Gartner, e o Forrester Wave, para 2009.

No que os dois relatórios 2009 tem consenso: EMC, IBM, Oracle e Open Text mantém forte liderança nesse mercado.

No que divergem: Para o Forrester, Microsoft avança e ganha momento mas tem diversas lacunas de funcionalidade, se posicionando apenas como forte competidor. Além disso, por seus critérios Hyland e HP são alternativas competitivas no nicho de conteúdo transacional e de negócios, sendo competentes em document management, imaging and capture, e records management; mas ficam devendo forte suporte em áreas como Web (WCM), document output management e digital asset management. E o open source Alfresco, embora mais atrás, tem aumentado sua amplitude na cobertura de ECM para desafiar os players proprietários como alternativa de baixo custo.

Já no critério do Gartner, Microsoft se posiciona tão líder quanto os outros quatro grandes, e Hyland (OnBase) e Autonomy (que adquiriu a Interwoven em março 2009) são respectivamente um desafiante e um visionário muito próximos de adentrarem o quadrante líder.

Fonte: Forrester, The Forrester Wave™: Enterprise Content Management Suites, Q4 2009 [PDF] (outro endereço); 2009-11-12; por Stephen Powers, Brian W. Hill, and Craig Le Clair; para profissionais de Information & Knowledge Management; reproduzido por Oracle.

Fonte: Gartner, Quadrante Mágico para Enterprise Content Management, 2009 [PDF]; 2009-10-15; por Toby Bell, Karen M. Shegda, Mark R. Gilbert, Kenneth Chin, Mick MacComascaigh; reproduzido por EMC, também por Oracle e por Microsoft.

Veja também o relatório do instituto Datamonitor Documents and Records Management: An Analysis of Market Trends to 2013 (Strategic Focus), fevereiro 2009, em Scribd.

Records Management / Gestão Arquivística Documental

No meio do ano o Forrester já publicara uma análise específica sobre os fornecedores de soluções em Records Management (RM), que em português podemos chamar de Gestão Arquivística de Documentos (GAD). GAD/RM é um dos componentes do universo de ECM.

De acordo como normas como o padrão internacional ISO 15489:2001 – Information and documentation — Records management Part 1: General e Part 2: Guidelines (originário do Padrão Australiano – AS), assim como normas e legislação do Brasil, os documentos arquivísticos são a informação registrada, produzida e recebida no decorrer das atividades de um órgão, entidade ou pessoa, dotada de organicidade e que sirva de prova dessas atividades. Os documentos e arquivos podem ser públicos (relativos ao poder, órgãos, agentes, empresas e serviços públicos) ou privados.

E a gestão arquivística consiste nos procedimentos referentes à produção, tramitação, uso, avaliação e arquivamento destes documentos em fase corrente e intermediária, visando a sua eliminação ou recolhimento para guarda permanente. (Resolução nº 20 Conarq, Art. 1º) Um elemento essencial para a gestão arquivística é a manutenção e aplicação de uma tabela de classificação (por assunto), temporalidade e destinação (ciclo de vida) de documentos.

Os quatro grandes de ECM também se posicionam na liderança desse segmento, mas existem outros dois líderes até mais fortes que os demais quando o foco é RM/GAD: Computer Associates (CA) e Autonomy (baseada na aquisição da Meridio em 2007).

Fonte: Forrester, The Forrester Wave™: Records Management, Q2 2009 [PDF]; 2009-06-23; por Brian W. Hill; para profissionais de Information & Knowledge Management; reproduzido por Oracle.

A área de Records Management nos Estados Unidos é muito direcionada em torno dos padrões de conformidade exigidos pelo Departamento de Defesa Americano (DoD). Mas os fornecedores de GAD também tem buscado certificação aderente aos dois mais proeminentes modelos mundiais: o Victorian Electronic Records Strategy (VERS) do Governo Australiano, e o MoReq2 – Model Requirements for the management of electronic records Europeu.


O MoReq2 é originário do modelo inglês MoReq. Estes modelos foram a base de referência para o padrão brasileiro e-ARQ Brasil [PDF] do CONARQ – Conselho Nacional de Arquivos, bem como o recente MoReq-Jus – Modelo de Requisitos para Sistemas Informatizados de Gestão de Processos e Documentos do Poder Judiciário do CNJ – Conselho Nacional de Justiça.

Para saber mais:

Com o início da vigência do Acordo Ortográfico da Língua Portuguesa no Brasil em 2009, uma necessidade decorrente dos usuários de computador é o suporte a esta reforma ortográfica nos programas.

O mais importante são os revisores ortográficos e gramaticais dos editores de texto, bem como dos programas onde há campos de entrada/digitação de texto, como os clientes de e-mail e os campos de texto dos navegadores/browsers internet.

Veja a seguir quais já oferecem suporte ao Acordo Ortográfico da Língua Portuguesa.

BrOffice/OpenOffice e Mozilla

O VERO – Verificador Ortográfico do projeto BrOffice.org inclui suporte ao acordo ortográfico desde a versão 2.0 já disponível em 1º de janeiro de 2009, graças ao trabalho do sergipano Raimundo Santos Moura.

Está disponível para uso com os programas do pacote de escritório BrOffice.org (editor de texto, planilha, apresentações, desenho) versões 3.x e 2.x (inclusive na divisão de sílabas).

Disponível também com os programas de internet da fundação Mozilla — o navegador Firefox, o cliente de e-mail Thunderbird, a suíte Seamonkey — na forma de extensão como dicionário pt_BR para o corretor ortográfico nativo.

Microsoft Office

A Microsoft liberou em 14/10/2009 o pacote de atualização KB972854 de 30/09/2009 para o Microsoft Office 2007, provendo suporte ao Acordo Ortográfico.

A página sobre a Atualização para o Verificador Ortográfico, Dicionário de Sinônimos e Verificador Gramatical do Microsoft Office 2007 também apresenta informações adicionais sobre a reforma ortográfica e indica Artigos sobre a Reforma Ortográfica da Língua Portuguesa.

Como o Microsoft Office 2003 já encerrou seu ciclo de vida principal de suporteem 14/04/2009, e entrou em suporte estendido apenas para atualizações de segurança até 2014 — a Microsoft deixou o suporte a essa versão de fora da atualização.

No Office 2007 com a atualização, observei que permanecia a autocorreção ao digitar de “linguiça” para “lingüiça” (com trema). Foi preciso eu remover manualmente: Opções do Word > Revisão de Texto > Opções de AutoCorreção > Substituir texto ao digitar > selecionar a substituição de linguiça > escolher o botão Excluir.

Para saber mais:

O Gartner publicou em 12 de agosto de 2009 o relatório de análise Quadrante Mágico para Plataformas de Governança Corporativa, Risco e Conformidade (E-GRC), por French Caldwell, Tom Eid e Carsten Casper.

Os fornecedores OpenPages, BWise e Thomson Reuters se destacam no quadrante líder, onde também está a Oracle, com mais completude de visão porém menos habilidade de executar que os outros três. A MetricStream aparece no limiar de entrada no quadrante líder.

Fonte: Magic Quadrant for Enterprise Governance, Risk and Compliance Platforms, redistribuído por Oracle.

Para contextualizar e compreender este Quadrante Mágico, é Importante ressaltar os aspectos abordados nas seções iniciais do relatório — de introdução e de visão geral e definição/descrição do mercado:

Os líderes provaram funcionalidades em GRC nas quatro funções primárias do GRCM (GRC management: gerenciamento de GRC) — gerenciamento de auditoria, gerenciamento de conformidade, gerenciamento de riscos e gerenciamento de políticas (policy).

GRCM é definido como a automação do gerenciamento, medição, resolução e relatório de controles e riscos em relação ao objetivos, de acordo com regras, regulamentação, padrões e políticas.

Muitas corporações tipicamente consideram uma aplicação de GRCM para satisfazer um requerimento específico, como conformidade com Sarbanes-Oxley, uma regulamentação específica de seu segmento ou o gerenciamento do risco operacional para um processo de negócio. Entretanto, instituições frequentemente tem outras atividades de GRCM em mente, como gerenciamento de auditoria, regulamentação adicional, governança de TI, gerenciamento de resolução (remediation) e gerenciamento de políticas/normas (policy), o que eventualmente pode ser integrado a uma abordagem mais consolidada de EGRC.

“Governança”, “gerenciamento de riscos” e “conformidade” são termos gerais que podem ser aplicados a uma vasta faixa de produtos, iniciativas de TI e requisitos de negócio. Estes três termos tem muitos definições válidas entre a base de clientes do Gartner. As definições a seguir ilustram o relacionamento entre os três termos:

  • Governança — O processo pelo qual políticas/normas (policies) são definidas e a tomada de decisão é executada.
  • Gerenciamento de Riscos – O processo para tratar riscos com um balanceamento de mitigação através da aplicação de controles, transferência através de seguro e aceitação através de mecanismos de governança.
  • Conformidade — O processo de aderência às políticas/normas e decisões. Políticas/normas podem ser derivadas de diretivas internas, procedimentos e requisitos, ou de leis, regulamentação, padrões e acordos externos.

Para uma caracterização mais abrangente desse mercado, o relatório recomenda os artigos: “A Comparison Model for the GRC Marketplace, 2008 to 2010” (2008-07-01) e “The Enterprise Governance , Risk and Compliance Platform Defined” (2008-02-19).

Também aguardo pelo Quadrante Mágico do Gartner para 2009 atualizando o mercado de Gestão de Conteúdo Corporativo (ECM), que deve ser publicado a qualquer momento neste terceiro trimestre. O relatório anterior foi lançado em 23 de setembro de 2008.

Em maio, comentei sobre a Fusões de gigantes também no mercado de ECM, quando ocorreu a compra da Vignette pela Open Text. Aproveitei para fazer um panorama atual sobre o mercado de Gestão de Conteúdo Corporativo (ECM).

Em 5 de agosto último saiu o Quadrante Mágico para Web Content Management (WCM) do Garner, para o mercado de gestão de conteúdo web (um segmento específico do ECM), de autoria dos analistas Mick MacComascaigh, Toby Bell e Mark R. Gilbert, Gartner.

Fonte: Gartner, agosto 2009, reproduzido por Oracle (Industry Analyst Reports sobre Oracle ECM/WCM).

A Oracle se posiciona este ano como líder, emparelhada com Autonomy, Open Text e SDL.

Irina Guseva comentou a análise em Parsing Gartner’s 2009 Magic Quadrant for Web Content Management em artigo para CMS Wire, 2009-08-10.

E ainda neste mês de setembro deve sair o novo relatório anual do Gartner com o Quadrante Mágico para ECM 2009. Vamos aguardar que alguma das principais empresas fornecedoras divulgue a análise para o público.

Fiz hoje uma pequena atualização do meu artigo PDF Livre com (ou sem) o Ghostscript, chegando à revisão número 12.

Depois de um “longo e tenebroso inverno” de mais de dois anos sem atualizações desde a versão 2.7 de 23/07/2007, o CutePDF Wirter foi atualizado em 26/08/2009, incorporando suporte ao Windows 7 em 32 e 64 bits. Em compensação, seu instalador saltou de modestos 1,54MB na versão 2.7 para 3,36MB na versão 2.8, mais do dobro do tamanho anterior.

Por falar em bits, como aos poucos aumenta a base instalada de Windows 64 bits, não só na versão Server mas também nos clientes Vista e Windows 7, incluí na tabela comparativa dos utilitários de geração de PDF por impressão a linha “Windows 32 e 64 bits” no quesito Compatibilidade. Só não pude conferir ainda se o PDF Creator garante suporte a Windows 64 bits, mas todos os demais utilitários suportam.

[Atualização em 12/08/2009: do PDF 6.3.308.]

Meu artigo PDF Livre com (ou sem) o Ghostscript teve sua 11ª revisão no último dia 6.

As novidades desta revisão são:

  • Acrescentado PrimoPDF ao quadro comparativo. Antes era só citado em outras opções. Falta incluir imagens ilustrativas.
  • Atualizados quadro comparativo e imagens ilustrativas para refletir as novas versões de doPDF, Bullzip PDF Printer, FreePDF e PDF Creator.
  • doPDF versão 6.3 permite escolher se o visualizador de PDF abrirá após a criação do PDF; antes sempre abria.
  • Bullzip PDF Printer agora provê suporte ao formato PDF/A-1 para arquivamento digital, em caráter experimental.
  • FreePDF retirou o “XP” do seu nome na versão 4, pois isto causava dúvidas nos usuários quanto a compatibilidade com Windows Vista.
  • Incluído tópico citando os recursos nativos de exportação e importação de PDF do OpenOffice/BrOffice.org, como alternativa ao uso das impressoras PDF quando trabalhando com documentos de escritório (texto, planilha, apresentação, desenho).
  • Desde a versão 3.07 de maio de 2005 o FreePDF inclui tradução para o Português (Brasil). Por isso, foi removido o já defasado tópico com o download da minha tradução para as versões 1.1 a 3.05 do FreePDF.

Espero que o artigo esteja, além de atualizado, ainda mais útil e abrangente agora.

Vi que já está disponível uma nova versão do GPL Ghostcript GPL 8.70, lançada em 1º de agosto. Ainda não tive oportunidade de testar esta nova versão com os programas de impressora PDF. Além do mais, os sites dos utilitários ainda recomendam a versão 8.64 e nem sequer está disponível no SourceForge as notas de lançamento dessa versão 8.70. Fica para uma futura revisão do artigo.

Não é só no mercado de infra e middleware que os líderes estão uns comprando os outros. No segmento de Gerenciamento de Conteúdo Corporativo (Enterprise Content Management – ECM), a canadense Open Text acaba de comprar a Vignette. Ambas empresas estão entre as principais no mercado de ECM, sendo que a Open Text é considerada por institutos de pesquisa uma das cinco líderes do setor, ao lado de EMC, IBM, Oracle e Microsoft.

Dentre as líderes, a Open Text é a única empresa exclusivamente focada em ECM; as outras atuam em diversos segmentos. Já a Vignette é especializada em conteúdo e mídia digital para web e Internet, ou seja, o segmento de ECM específico de Gerenciamento de Conteúdo Web (Web Content Management – WCM) e Sistemas de Gerenciamento de Conteúdo (Content Management Systems – CMS).

Open Text compra Vignette por US$ 310 milhões, por IT Web, 2009-05-08.

Press release por Open Text (Waterloo, Ontario, Canadá) e Vignette (Austin, Texas, EUA): Open Text to Acquire Vignette (idem na Vignette), 2009-05-06.

Veja a evolução do Quadrante Mágico do Gartner, do Forrester Wave e do Datamonitor Decision Matrix para o mercado de ECM nos últimos anos:

Fonte: Gartner, Quadrante Mágico para Enterprise Content Management, 2008; 2008-09-23; por Karen M. Shegda, Toby Bell, Kenneth Chin, Mark R. Gilbert, Mick MacComascaigh; reproduzido por Microsoft; também por EMC, por Oracle e por Day Software.

Fonte: Gartner, Quadrante Mágico para Enterprise Content Management, 2007 [PDF]; 2007-09-21; por Karen M. Shegda, Toby Bell, Kenneth Chin, Mark R. Gilbert; reproduzido por IBM.

Fonte: Forrester, The Forrester Wave™: Enterprise Content Management Suites, Q4 2007 [PDF]; 2007-11-09; por Kyle McNabb, para Information & Knowledge Management Professionals; reproduzido por Oracle.

Fonte: Datamonitor, Decision Matrix: Selecting an Enterprise Content Management Vendor (Competitor Focus) [PDF]; dezembro 2006; reproduzido por EMC Corporation em ECM Connection.

Fonte: Gartner, Magic Quadrant for Enterprise Content Management, 2006; 2006-10-11; por Karen M. Shegda, Kenneth Chin, Mark R. Gilbert, Debra Logan, Toby Bell, Lou Latham.

Empresas e produtos considerados líderes:

Desafiantes:

  • Autonomy Interwoven (aquisição em janeiro 2009) – também focada em ambiente web/internet, assim como a Vignette.
  • Hyland Software – OnBase – solução de GEC/ECM muito amigável.
  • Xerox – DocuShare.
  • Alfresco – Alfresco Enterprise – software de código aberto criado por dissidentes da Documentum.

CMS Watch – Mapa de Fornecedores ECM, em estilo “mapa de metrô”:

CMS Watch - ECM Subway Vendor Map

Para saber mais:

Próxima Página »